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L'invention concerne de nouvelles sequences d'acides nucleiques de la 
famille des genes suppresseurs de tumeurs apparentee avec le gene de la 
proteine p53, et les sequences proteiques correspondantes. 

L'invention concerne egalement les applications prophylactiques, 
therapeutiques et diagnostiques de celles-ci, notarnment dans le domaine des 
pathologies liees aux phenomenes d'apoptose ou de transformation cellulaire. 

Les genes suppresseurs de tumeurs jouent un role clef dans la protection 
contre les phenomenes de cancelation, et toute modification susceptible 
d'entrainer la perte de I'un de ces genes, son inactivation ou son 
dysfonctionnement, peut avoir un caractere oncogene, creant ainsi des 
conditions favorables au developpement d'un cancer. 

Les auteurs de la presente invention ont identifie les produits de 
transcription d'un nouveau gene ainsi que les proteines correspondantes. Ce 
gene SR-p70. est apparente au gene suppresseur de tumeur p53, dont 
I'activite anti-tumorale est liee a son activite de facteur de transcription et plus 
specifiquement aux controles exerces sur I'activite des genes Bax et Bcl-2. 
instrumentaux dans les mecanismes de mort cellulaire. 

La presente invention est done relative a des proteines purifiees SR-p70. 
ou des fragments biologiquement actifs de celles-ci. 

L'invention concerne egalement des sequences d'acides nucleiques isolees 
codant pour lesdites proteines ou leurs fragments biologiquement actifs et les 
sondes nucleotidiques obtenues a partir de ces sequences. 

Elle vise en outre les vecteurs de clonage et/ou depression contenant au 
moins Tune des sequences nucleotidiques definies ci-dessus, et les cellules 
notes transferees par ces vecteurs de clonage et/ou depression dans des 
conditions permettant la replication et/ou I'expression de I'une desdites 
sequences nucleotidiques. 

Les methodes de production de proteines recombinantes SR-p70 ou de 
leurs fragments biologiquement actifs par les cellules notes transferees font 
egalement partie de l'invention. 

L'invention comprend egalement des anticorps ou des derives d'anticorps 
specifiques des proteines definies ci-dessus. 

Elle vise en outre des methodes de detection des cancers, soit par la 
-mesure de ('accumulation des proteines SR-p70 dans les tumeurs selon des 
techniques d'immuno-histochimie, soit par la mise en evidence dans le serum 
de patients d'auto-anticorps diriges contre ces proteines. 



L'invention concerne egalement tout inhibiteur ou activateur de I'activite du 
SR-p70 par exemple d'interaction proteine-proteine faisant intervenir le SR- 
p70. 

Elle conceme aussi des sequences oligonucleotidiques antisens pouvant 
moduler in vivo I'expression du gene SR-p70. 

L'invention comprend enfin une methode de therapie genique dans laquelle 
des vecteurs tels que par exemple des vecteurs viraux inactives capables de 
transferer des sequences codantes pour une proteine selon l'invention sont 
injectes a des cellules deficientes pour cette proteine, a des fins de regulation 
des phenomenes d'apoptose ou de reversion de la transformation. 

La presente invention a pour objet un polypeptide purifie comprenant une 
sequence d'acides amines choisie parmi : 

a) la sequence SEQ ID n° 2 ; 

b) la sequence SEQ ID n° 4 ; 

c) la sequence SEQ ID n° 6 ; 

d) la sequence SEQ ID n # 8 ; 

e) la sequence SEQ ID n* 10 ; 

f) toute sequence biologiquement active derivee de SEQ ID n° 2, SEQ ID 
n° 4, SEQ ID n* 6. SEQ ID n' 8 ou SEQ ID n* 1 0. 

Dans la description de l'invention. on utilise les definitions suivantes 
- proteine SR-p70 : un polypeptide comprenant une sequence d'acides 
amines choisie parmi les sequences SEQ ID n° 2. SEQ ID n° 4, SEQ ID n° 6, 
SEQ ID n* 8 ou SEQ ID n* 10, ou tout fragment ou derive de celui-ci biologi- 
quement actif. 

_ - derive : tout polypeptide variant du polypeptide de sequence SEQ ID n°2, 
SEQ ID n° 4, SEQ ID n° 6, SEQ ID n* 8 ou SEQ ID n* 10. ou toute molecule 
resultant d'une modification de nature genetique et/ou chimique de la sequence 
SEQ ID n° 2. SEQ ID n° 4. SEQ JD n* 6, SEQ ID rT 8 ou SEQ ID n # 10. c'est- 
a-dire obtenue par mutation, deletion, addition, substitution et/ou modification 
chimique d'un seul ou d'un nombre limite d'acides amines, ainsi que toute 
sequence isoforme. c'est-a-dire une sequence identique a la sequence SEQ 
ID n° 2 ou SEQ ID n° 4. SEQ ID n 6. SEQ ID n* 8 ou SEQ ID n* 10. a Tun de 
.ses fragments ou sequences modifiees. contenant un ou plusieurs acides 
amines sous la forme d'enantiomere D. lesdites sequences variantes. modifiees 
ou isoformes ayant conserve au moins I'une des proprietes les rendant 
biologiquement actives. 
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- biologiquement actif : capable de se lier a I'ADN eVou d'exercer une 
activite de facteur de transcription et/ou de participer au controle du cycle 
cellulaire, de la differenciation et de I'apoptose et/ou capable d'etre reconnu par 
les anticorps specifiques du polypeptide de sequence SEQ ID n°2, SEQ ID n°4, 
5 SEQ ID n° 6, SEQ ID n* 8 ou SEQ ID n* 10, et/ou capable d'induire des 

anticorps qui reconnaissent ce polypeptide. 

La fabrication de derives peut avoir differents objectifs, dont en particulier 
celui d'augmenter I'affinite du polypeptide pour I'ADN ou son activite de facteur 
de transcription, celui d'ameliorer ses taux de production, d'augmenter sa 
10 resistance a des proteases, de modifier ses activites biologiques ou de lui 

conferer de nouvelles proprietes pharmaceutiques et/ou biologiques. 

Parmi les polypeptides de I'invention, on prefere le polypeptide d'origine 
humaine, comprenant la sequence SEQ ID n° 6. Ce polypeptide de 636 acides 
amines est identique a plus de 97 % au polypeptide de sequence SEQ ID n° 2. 
15 Le polypeptide de sequence SEQ ID n° 2 et celui de sequence SEQ ID n° 4 

sont deux produits d'expression d'un meme gene, de meme pour les SEQ ID 
n'8etSEQIDn*10. 

Comme il sera explique dans les exemples, le polypeptide de sequence 
SEQ ID n° 4 correspond a une terminaison prematuree du peptide de sequence 
20 SEQ ID n* 2. liee a un epissage alternatif du transcript codant pour le 

polypeptide de SEQ ID n* 2 le plus long (ARN messager) du gene 
correspondant. La sequence peptidique N-terminale de la sequence SEQ ID n* 
10 est deletee, ce lie a un epissage alternatif de son transcript codant, comme 
poor la sequence SEQ ID n* 4.- 
25 Avantageusement, I'invention vise un polypeptide correspondant au 

domaine'de fixation sur I'ADN de I'un des polypeptides precedents. 

Ce domaine correspond a la sequence comprise entre le residu 110 et le 
residu 310 pour les sequences SEQ ID n* 2, 4 ou 6, le residu 60 et le residu 
260 pour la sequence SEQ ID n* 8 et le residu 109 et le residu 123 pour la 

30 sequence SEQ ID n* 10. 

La presente invention a egalement pour objet des sequences d'acides 
nucleiques codant pour une proteine SR-p70 ou des fragments ou derives de 
celle-ci biologiquement actif s. 

Plus preferentiellement, I'invention a pour objet une sequence nucleotidique 

d'acides nucleiques isolee choisie parmi : 
a) la sequence SEQ ID n° 1 ; 
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b) la sequence SEQ ID n° 3 ; 

c) la sequence SEQ ID n° 5 ; 

d) la sequence SEQ ID n*7 ; 

e) la sequence SEQ ID n'9 ; 

5 f) les sequences d'acides nucleiques capables de s'hybrider a la sequence 

SEQ ID n° 1, SEQ ID n° 3, SEQ ID n° 5, SEQ ID n"7 ou SEQ ID n'9 ou a leurs 
sequences complementaires, ou de s'hybrider a leurs sequences proximales. 

g) les sequences derivees des sequences a), b), c), d), e) ou f) du fait de la 
degenerescence du code genetique. 
10 Selon un mode de realisation prefere, I'invention a pour objet la sequence 

nucleotidique SEQ ID n° 5 correspondant a I'ADNc de la proteine humaine de 

sequence SEQ ID n° 6. 

Les differentes sequences nucleotidiques de I'invention peuvent etre 

d'origine artificielle ou non. II peut s'agir de sequences d'ADN ou d'ARN, 
15 obtenues par criblage de banques de sequences au moyen de sondes 

elaborees sur la base des sequences SEQ ID n° 1 , 3, 5, 7 ou 9. De telles 

banques peuvent etre preparees par des techniques classiques de biologie 

moleculaire, connues de I'homme de Tart. 

Les sequences nucleotidiques selon I'invention peuvent egalement etre 
20 preparees par synthese chimique. ou encore par des methodes mixtes incluant 

la modification chimique ou enzymatique de sequences obtenues par criblage 

de banques. 

Ces sequences nucleotidiques permettent la realisation de sondes 
nucleotidiques, capables de s'hybrider specifiquernent avec une sequence 

25 d'acides ^nucleiques, y compris un ARN messager, codant pour un polypeptide 

selon I'invention ou un fragment biologiquement actif de celui-ci. De telles 
sondes font egalement partie de I'invention. Elles peuvent etre utilisees cornme 
outil de diagnostic in vitro pour la detection, par des experiences d'hybridation. 
de transcripts specifiques des polypeptides de I'invention dans des echantillons 

30 biologiques ou pour la mise en evidence de syntheses aberrantes ou d'anoma- 

lies genetiques telles que la perte d'heterozygotie ou le rearrangement 
genetique, resultant d'un polymorphisme, de mutations ou d'un epissage 
different. 

Les sondes de I'invention component au minimum 10 nucleotides, et au 
3 5 , ' maximum comportent la totalite de la sequence du gene SR-p70 contenu par 
exemple dans un cosmide. 



Parmi les sondes les plus courtes, c l est-a-dire d'environ 10 a 20 
nucleotides, les conditions d'hybridation appropriees correspondent aux 
conditions de temperature et deforce ionique usuellement utilisees par I'homme 
du metier. 

Avantageusement, ces sondes sont representees par les oligonucleotides 
suivants ou leurs complementaires : 

SEQ ID n # 1 1 : GCG AGC TGC CCT CGG AG 
SEQ ID n* 12 : GGT TCT GCA GGT GAC TCA G 
SEQ ID n* 1 3 : GCC ATG CCT GTC TAC AAG 
SEQ ID n* 14 : ACC AGC TGG TTG ACG GAG 
SEQ ID n* 15 : GTC AAC CAG CTG GTG GGC CAG 
SEQ ID n* 16 : GTG GAT CTC GGC CTC C 

Preferentiellement, les sondes de I'invention sont marquees, 
prealablement a leur utilisation. Pour cela, plusieurs techniques sont a la portee 
de I'homme du metier (marquage fluorescent, radioactif, chimioluminescent, 
enzymatique, etc). 

Les methodes de diagnostic in vitro dans lesquelles ces sondes 
nucleotidiques sont rnises en oeuvre, sont incluses dans I'objet de la presente 
invention. 

Ces methodes concernent par exemple la detection de syntheses 
anormales (ex. accumulation de produits de transcription) ou d'anomalies 
genetiques, telles que la perte d'heterozygotie et le rearrangement genetique, et 
les mutations ponctuelles au niveau des sequences nucleotidiques d'acides 
noeleiques codant pour une-proteine SR-p70, selon la definition donnee 
precedemment. 

r l_ es sequences nucleotidiques de I'invention sont egalement utiles pour la 
fabrication et I'utilisation d'amorces oligonucleotidiques pour des reactions de 
sequengage ou d'amplification specifique selon la technique dite de PCR ou 
toute variante de celle-ci (Ligase Chain Reaction (LCR), ...). 

Des paires d'amorces preferees sont constituees par des amorces choisies 
sur les sequences nucleotidiques : SEQ ID n° 1 : sequence de singe de 2 874 
nucleotides et SEQ ID n # 5 : ADNc SR-p70 humain, notamment en amont du 
codon ATG d'initiation et en aval du codon TGA d'arret de traduction. 

Avantageusement, ces amorces sont representees par les couples 
suivants: 



- couple n*1 : : SEQ ID n° 1 1 

amorce sens : GCG AGC TGC CCT CGG AG 



: SEQ ID n° 12 
amorce antisens : GGT TCT GCA GGT GAC TCA G 

- couple n'2 : :SEQIDn*13 

amorce sens : GCC ATG CCT GTC TAC AAG 

: SEQ ID n* 14 
amorce antisens : ACC AGC TGG TTG ACG GAG 

- couple n° 3 : :SEQIDn°15 

amorce sens : GTC AAC CAG CTG GTG GGC CAG 

: SEQ ID n° 16 
amorce antisens : GTG GAT CTC GGC CTC C 

Ces amorces correspondent aux sequences allant respectivement : 

-•du nucleotide n° 124 au nucleotide n° 140 sur SEQ ID n\i et du 
nucleotide n' 1 au nucleotide n' 17 sur SEQ ID n'5 pour SEQ ID N° 1 1 

- du nucleotide n° 2280 au nucleotide n° 2262 sur SEQ ID n\1 et du 
nucleotide n* 2156 au nucleotide 2138 sur SEQ ID n'5 pour SEQ ID N° 12 

- du nucleotide n° 684 au nucleotide n° 701 sur SEQ ID n* 1 pour SEQ ID 
N°13 

-du nucleotide n° 1447 au nucleotide n° 1430 sur SEQ ID n« 1 et du 
nucleotide 1324 au nucleotide 1307 sur SEQ ID n'5 pour_SEQ ID N° 1 4 

- du nucleotide 1434 au nucleotide 1454 sur SEQ ID n'1 et du nucleotide 
1311 au nucleotide1331 sur SEQ ID n*5 pour SEQ ID n* 15 

- du nucleotide 2066 au nucleotide 2051 sur SEQ ID n'1 et du nucleotide 
1940 au nucleotide 1 925 dans SEQ ID n'5 pour SEQ ID n*16. 

Les sequences nucleotidiques selon Invention pourraient avoir par ailleurs 
: des utilisations en therapie genique, notamment pour le controle des phenome- 
nes d'apoptose et de reversion de la transformation. 



Les sequences nucleotidiques selon I'invention peuvent par ailleurs etre 
utilisees pour la production de proteines recombinantes SR-p70, selon la 
definition qui a ete donnee a ce terme. 

Ces proteines peuvent etre produites a partir des sequences nucleotidiques 
definies ci-dessus, selon des techniques de production de produits recombi- 
nants connues de I'homme du metier. Dans ce cas, la sequence nucleotidique 
utilisee est placee sous le controle de signaux permettant son expression dans 
un hote cellulaire. 

Un systeme efficace de production d'une proteine recombinante necessite 
de disposer d'un vecteur, par exemple d'origine plasmidique ou virale, et d'une 
cellule hote compatible. 

L'hote cellulaire peut etre choisi parmi des systemes procaryotes, comme 
les bacteries, ou eucaryotes, comme par exemple les levures, cellules 
d'insectes, CHO (cellules d'ovaires de hamster chinois) ou tout autre systeme 
avantageusement disponible. Un hote cellulaire prefere pour 1'expression des 
proteines de I'invention est constitue par la bacterie E. col'h notamment la 
souche MC 1061 (Clontec). 

Le vecteur doit comporter un promoteur, des signaux d'initiation et de 
terminaison de la traduction, ainsi que les regions appropriees de regulation de 
la transcription. II doit pouvoir etre maintenu de fagon stable dans la cellule et 
peut eventuellement posseder des signaux particuliers specifiant la secretion 
de la proteine traduite. 

Ces differents signaux de controle sont choisis en fonction de l'hote 
celhjlalre utilise. A cet effet, ies sequences nucleotidiques selon I'invention 
peuvent etre inserees dans des vecteurs a replication autonome au sein de 
I'hofe choisi, ou des vecteurs integratifs de I'hote choisi. De tels vecteurs seront 
prepares selon les methodes couramment utilisees par I'homme du metier, et 
les clones en resultant peuvent etre introduits dans un hote approprie par des 
methodes standard, telles que par exemple Telectroporation. 

Les vecteurs de clonage et/ou d'expression contenant au moins Tune des 
sequences nucleotidiques definies ci-dessus font egalement partie de la 
presente invention. 

Un vecteur de clonage et d'expression prefere est le plasmide PSE1 qui 
"comporte a lafois les elements necessaires pour son utilisation comme vecteur 
de clonage dans E.coli (origine de replication dans E. colieX gene de resistance 
a I'ampicilline, provenant du plasmide pTZ 18R), et comme vecteur 
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d'expression dans les cellules animales (promoteur, intron, site de polyadenyla- 
tion, origine de replication du virus SV40), ainsi que les elements permettant sa 
copie en simple brin dans un but de sequengage (origine de replication du 
phage f1). 

Les caracteristiques de ce plasmide sont decrites dans la demande 
EP 0 506 574. 

Sa construction, ainsi que Integration des ADNc provenant des sequences 
d'acides nucleiques de I'invention sont par ailleurs decrites dans les exemples 
ci-apres. 

Selon un mode de realisation prefere, les proteines de I'invention sont sous 
forme de proteines de fusion, notamment sous forme de proteine fusionnee 
avec la glutathione S-transf erase (GST). Un vecteur d'expression designe dans 
ce cas est represents par le vecteur plasmidique pGEX-4T-3 (Pharmacia ref- 
27.4583). 

L'invention vise en outre les cellules hotes transfectees par ces vecteurs 
precedents. Ces cellules peuvent etre obtenues par I'introduction dans des 
cellules hotes d'une sequence nucleotidique inseree dans un vecteur tel que 
defini ci-dessus, puis la mise en culture desdites cellules dans des conditions 
permettant la replication et/ou I'expression de la sequence nucleotidique 
transfectee. 

Ces cellules sont utilisables dans une methode de production d'un 
polypeptide recombinant de sequence SEQ ID n° 2, SEQ ID n° 4, SEQ ID n' 6. 
SEQ ID n*8 ou SEQ ID n*10, ou tout fragment ou derive biologiquerrient actif de 
cetui-ci. 

La methode de production d'un polypeptide de I'invention sous forme 
recombinante est elle-meme comprise dans la presente invention, et se 
caracterise en ce que I'on cultive les cellules transfectees dans des conditions 
permettant I'expression d'un polypeptide recombinant de sequence SEQ ID n° 
2, SEQ ID n° 4, SEQ ID n* 6, SEQ ID n*8 ou SEQ ID n'10, ou de tout fragment 
ou derive biologiquement actif de celui-ci, et que I'on recupere ledit polypeptide 
recombinant. 

Les procedes de purification utilises sont connus de I'homme du metier. Le 
polypeptide recombinant peut etre purifie a partir de lysats et extraits cellulaires, 
du surnageant du milieu de culture, par des methodes utilisees individuellement 
bu en combinaison, telles que le fractionnement, les methodes de chromato- 
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graphie, les techniques d'immunoaffinite a I'aide d'anticorps mono ou 

polyclonaux specifiques, etc. 

Une variante preferee consiste a produire un polypeptide recombinant 
fusionne a une proteine "porteuse" (proteine chimere). Lavantage de ce 
5 systeme est qu il permet une stabilisation et une diminution de la proteolyse du 

produit recombinant, une augmentation de la solubilite au cours de la 
renaturation in vitro et/ou une simplification de la purification lorsque le parte- 
naire de fusion possede une affinite pour un ligand specifique. 

Avantageusement, les polypeptides de 1'invention sont fusionnes avec la 
10 g.utathione S-transferase en position N-terminale (systeme »GST» Pharmac.a). 

Le produit de fusion est dans ce cas detecte et quantifie grace a PactMte 
enzymatique de la GST. Le reactif colorimetrique utilise est un accepteur de 
glutation, substrat de la GST. Le produit recombinant est purifie sur un support 
de chromatographie auquel ont ete prealablement couplees des molecules de 

15 glutathion. „ M u m 

Les anticorps mono ou polyclonaux capables de reconnaitre 
specifiquement une proteine SR- P 70 selon la definition donnee precedemment 
font egalement partie de ."invention. Des anticorps polyclonaux peuvent etre 
obtenus a partir du serum d'un animal immunise contre la proteine. produ.te par 

20 exemple par recombinaison genetique suivant la methode decrite c-dessus, 

selon les modes operatoires usuels. 

Les anticorps monoclonaux peuvent etre obtenus selon la methode 
classique de culture d'hybridomes decrite par Kohler et Milstein, Nature, 1975. 
256 495-497 

25 - Des anticorps avantageux sont des anticorps diriges contre la region 

centrales residu 1 10-310. . . 

Les anticorps selon I'invention sont par exemple des anticorps ch.mer.ques 
des anticorps humanises, des fragments Fab et F (ab')2. lis peuvent egalement 
se presenter sous forme d'immunoconjugues ou d'anticorps marques. 
30 p ar ailleurs. outre leur utilisation pour la purification des polypept.des 

recombinants, les anticorps de .'invention, en particular les arftcorp. 
monoclonaux. peuvent egalement etre utilises pour la detect.on de ces 
polypeptides dans un echantillon biologique. 
- L constituent ainsi ~un moyen d'analyse ^mrnunocytoch.m.que ou 
^immunohistochimique de ^expression de proteines SR- P 70 sur des coupes de 
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tissus specifiques, par exemple par immunofluorescence, marquage a I'or, 
immunoperoxydase, ... 

lis permettent notamment de mettre en evidence une accumulation 
anormale de proteines SR-p70 dans certains tissus ou prelevements biologi- 
5 ques, ce qui les rend utiles pour la detection des cancers ou le suivi de 

revolution ou de la remission de cancers preexistants. 

Plus generalement, les anticorps de invention peuvent etre 
avantageusement mis en oeuvre dans toute situation ou I'expression d'une 
proteine SR-p70 doit etre observee. 
10 L'invention conceme done egalement un procede de diagnostic in vitro de 

pathologies correlees a une expression ou une accumulation anormale de 
proteines SR-p70. notamment les phenomenes de cancelation, a partir d'un 
prelevement biologique. caracteris* en ce que I'on met en contact au moins un 
anticorps de l'invention avec ledit prelevement biologique, dans des conditions 
15 permettant la formation eventuelle de complexes immunologiques specifiques 

entre une proteine SR-p70 et le ou lesdits anticorps et en ce que Ton detecte 
les complexes immunologiques specifiques eventuellement formes. 

L'invention concerne egalement un kit pour le diagnostic in vitro d'une 
expression ou une accumulation anormale de proteines SR-p70 dans un 
20 prelevement biologique et/ou pour la mesure du taux d'expression de celle-ci 

dans ledit prelevement comprenant : 

- au moins un anticorps specifique d'une proteine SR-p70, eventuellement 

fixe sur un support, 

"\-des moyens de revelation de la formation de complexes 
25 antigenes/anticorps specifiques entre une proteine SR-p70 et ledit anticorps 

et/ou des moyens de quantification de ces complexes. 

L'invention vise egalement une methode de diagnostic precoce de la 
formation des tumeurs, par la mise en evidence dans le serum d'un individu, 
d'auto-anticorps diriges contre une proteine SR-p70. 
30 Une telle methode de diagnostic precoce est caracterise en ce que Ton met 

en contact un echantillon de serum preleve chez un individu avec un polypep- 
tide de l'invention. eventuellement fixe sur un support, dans des conditions 
permettant la formation de complexes immunologiques specifiques entre ledit 
polypeptide et les auto -anticorps eventuellement presents dans I'echantillon de 
- 35 . ' serum, et en ce que I'on detecte les complexes immunologiques specifiques 
eventuellement formes. 
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^invention comprend egalement des compositions pharmaceut.ques 
comprenant comme principe actif un polypeptide repondant aux dafinrtons 
precedentes. preferentiellement sous forme soluble, associe a un veh,cule 
pharmaceutiquement acceptable. 

De telles compositions offrent une nouvelle approche pour tra.ter les 
phenomenes de cancelation au niveau du controle de la multip.icat.on et la 

differenciation cellulaire. 

Preferentiellement, ces compositions peuvent etre admimstrees par vo.e 
systematique, de preference par voie intraveineuse, par voie intramuscula.re. 

intradermique ou par voie orale. , 

Leurs modes d'administration, posologies et formes galemques 
optimaux peuvent etre determines selc-n les criteres generalement pns en 
compte dans ,'etablissement d'un tttfament therapeutique adapts a m patent 
comme par exemp.e ."age ou .e poWs corporel du patient, la gravite de son etat 
general, la tolerance au traitement et les effets secondares 

Uinvention comprend enfin une methode de therap.e gen.que dans iaquelle 
des sequences nucleotidiques codant pour une proteine SR- P 70 sont 
transferees a des cellules cibles par le biais de vecteurs viraux inact.ves. 

D'autres caracteristiques et avantages de Invention apparaissent dans la 
suite de la description avec les exemp.es et les figures dont les legendes sont 
representees ci-apres. 

- LEGENDE DES FIGURES 

Viqure 1 • Comparison nucleique de I'ADNc du SR- P 70a de singe 

(correspondant a SEQ ID n* 1) avec la sequence nucle.que de 
I'ADNc de p53 de singe. 

Figure 2 : Comparison proteique de SR- P 70a de singe avec la 
proteine p53 de singe (sw : p53-cerae). 

Figure 3 • Comparison de la sequence nucleique de I'ADNc de ^ 
SR-p70a -et b de singe (correspondant respective ment a 
SEQ ID n # 1 et SEQ ID n* 3). 
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Figure 4 : 



Figure 5 : 



Figure 6 : 



Figure 7 : 



Figure 8 : 



Figure 9 



Sequence nucleique et sequence proteique deduite de 
SR-p70a de singe. 

Sequence nucleique partielle et sequence proteique deduite 
complete de SR-p70b de singe. 

Sequence nucleique partielle et sequence proteique 
complete deduite de SR-p70 d'homme (correspondant a 
SEQ ID n* 5). 

Sequence nucleique partielle et sequence proteique deduite 
complete de SR-p70c de souris (correspondant a 
SEQ ID n' 7). 

Sequence nucleique partielle et sequence proteique deduite 
partielle de SR-p70a de souris (correspondant a 
SEQ ID n* 9). 

Multialignement des proteines deduites des ADNc SR-p70 
de singe (a et b) , d'homme et de souris (a et c) . 



Figure 10a : Immunoempreinte de la proteine SR-p70. 
Figure 10b : Detection de la proteine endogene SR-p70. 
Figure 1 1 : Localisation^chromosomique du gene SR-p70 humam. Le 
signal apparaTt sur le chromosome 1 , dans la region p36. 

EXEMPLE I 

Clonage de I'ADNc du SR-p70 de cellules COS-3. 
1 Culture des cellules COS-3 

Les cellules COS-3 (cellules de rein de singe vert d'Afrique ; <^form e es 
par i'antigene T du virus SV 40) son. cultivees dans le milieu DMEM (QBOO- 
BRL) reference 41 965-047) contenan. 2 mM de I-glutamine * «^« n -' 
avec 50 mg/l de gentamycine et de 5 % de serum de bovin foetal (GIBCO-BRU 
reference 10231-074) jusqu'a semi-confluence. 
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2. Preparation de I'ARN messager 
■ a) extraction de I'ARN messager 

Les cellules sont recuperees de la facon suivante : 

- les cellules adherentes sont lavees deux fois avec du tampon PBS 
(phosphate buffered saline, reference 04104040-GIBCO-BRL) puis grattees 
avec un grattoir en caoutchouc et centrifugees. 

Le culot cellulaire est mis en suspension dans le tampon de lyse de 
composition suivante : guanidine-thiocyanate 4M ; citrate de sodium 25mM pH 
7 ; sarcosyl 0,5 % ; (5-mercaptoethanol 0,1 M. La suspension est soniquee a 
I'aide d'un sonicateur ultra turax n° 231256(Janke et Kundet) a puissance 
maximale pendant une minute. On ajoute de I'acetate de sodium pH 4 jusqu'a 
0,2 M. La solution est extraite avec un volume d'un melange 
phenol/chloroforme (v/v ; 5/1). On precipite a -20°C I'ARN contenu dans la 
phase aqueuse a I'aide d'un volume d'isopropanol. Le culot est resuspendu 
dans le tampon de lyse. La solution est a nouveau extraite avec un melange 
phenol/chloroforme et I'ARN est precipite avec de I'isopropanol. Apres lavage 
du culot avec de I'ethanol 70 % puis 100 %, I'ARN est resuspendu dans de 
I'eau. 

b) Purification de la fraction poly A* de I'ARN 

La purification de la fraction poly A* de I'ARN est realisee a I'aide du kit 
Dynabeads oligo (dT) 25 de DYNAL (reference 610.05) suivant le protocole 
preconise par le fabricant. Le principe est base sur ('utilisation de billes 
polystyrene super-paramagnetique sur lesquelles est attache un 
oligonucleotide poly(dT) 2S . La fraction poly A' de I'ARN est hybridee sur 
l'oligo(df) 25 couple aux billes que I on piege sur un support magnetique. 

3. Constitution de la banque d'ADN complementaire 
a) preparation de I'ADN complementaire 

A partir de 0,5 ug des ARN-poly A* de cellules COS-3 obtenues a Tissue 
de I'etape 2, on prepare I'ADN complementaire simple-brin marque au 
32 P.dCTP (I'ADN complementaire obtenu presente une activite specifique de 
3000 dpm/ng) avec I'amorce synthetique de sequence suivante (comprenant un 

" site BamHI) : 

5'<GATCCGGGCC CI I I I II I I I TTT<3' 



14 



Dans un volume tie 30 de tampon de composition : Tris HCI 50 mM pH 
8,3, MgCI 2 6 mM, DTT 10 mM, KCI 40 mM, contenant 0,5 mM de chacun des 
desoxynucleotides triphosphates, 30uCi de dCTP a 32 P et 30 U de RNasin 
(promega). Apres une heure d'incubation a 37°C, puis 10 minutes a 50°C, puis 
5 de nouveau 10 minutes a 37°C, avec 200 unites de I'enzyme transcriptase 

inverse RNase H" (GIBCO-BRL reference 8064A), on ajoute 4 nl d'EDTA. 

b) Hydrolyse alcaline de la matrice ARN 

On ajoute 6 y\ d'une solution de NaOH 2N, puis on incube pendant 5 
minutes a 65°C. 
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c) Purification sur colonne sephacryl S400 

Afin d'eliminer I'amorce synthetique, on purifie I'ADN complementaire sur 
une colonne de 1 ml de sephacryl S400 (Pharmacia), equilibree dans du 
tampon TE. 

Les deux premieres fractions radioactives sont regroupees et precipitees 
avec 1/10 de volume d'une solution d'acetate d'ammonium 10 M et 2,5 volumes 
d'ethanol, ceci apres une extraction, avec un volume de chloroforme. 

d) Addition homopolymerique de dG 

On allonge I'ADN complementaire en 3' avec une "queue" de dG avec 20 
unites de I'enzyme terminale transferase (Pharmacia 27073001). On incube 
dans 20 \i\ de tampon de composition : Tris HCI 30 mM pH 7,6 ; chlorure de 
cobalt 1mM, acide cacodylique 140 mM, DTT 0,1 mM, dGTP 1 mM, pendant 15 
minutes a 37°C ( puis on ajoute 2 d'EDTA 0,5 M. 

e) On repete a nouveau les etapes b) et c) 

f) Appariement du vecteur de clonage pSE1 (EP 506 574) et de I'ADN 
complementaire en presence de I'adaptateur. 

On centrifuge, le culot est dissous dans 33 |ul de tampon TE, on ajoute 5 
(125 ng) de vecteur de clonage pSE1, 1 !al(120 ng) de I'adaptateur de 
sequence suivante (comprenant un site Apal), 
5' AAAAAAAAAAAAAG G G CC C G3* 

10 iliI d'une solution de NaCI 200 mM, on incube pendant 5 minutes a 65° 
C puis on laisse refroidir le melange reactionnel jusqu'a temperature ambiante. 

g) Ligation 

'-On ligue le vecteur de cloaage et I'ADNc simple brin dans un volume de 
100 faf avec 32,5 unites de I'enzyme ADN ligase du phage T4 (Pharmacia 
reference 270 87002) pendant une nuit a 15°C dans un tampon de composi- 
tion : Tris HCI 50 mM pH 7,5, MgCI 2 10 mM, ATP 1 mM. 

h) Synthese du deuxieme brin de I'ADNc 

V 

On elimine les proteines par extraction au phenol suivie d'une extraction au 
chloroforme, puis on ajoute 1/10eme de volume d'une solution d'acetate 
d'ammonium 10 mM, puis 2,5 volumes d'ethanol. On centrifuge, le culot est 
dissous dans le tampon de composition Tris acetate 33 mM pH 7,9 acetate de 
potassium 62,5 mM, acetate de magnesium 1 mM et dithiothreitol (DTT) 1 mM, 
le deuxieme brin d'ADN complementaire est synthetise'dans un volume de 30 \x 
l : avec 30 unites de I'enzyme ADN polymerase du phage T4 (Pharmacia, 
reference 270718) et un melange de 1 mM des quatre desoxynucleotides 
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triphosphates de dATP, dCTP, dGTP et dTTP. ainsi que deux unites de la 
proteine du gene 32 du phage T4 (Pharmacia, reference 27-0213)) pendant 
une heure a 37°C. On extrait au phenol et on retire les traces de phenol par une 
colonne de polyacrylamide P10 (Biogel P1 0-200-400 mesh - reference 
15011050 - Biorad). 

i) Transformation par electroporation 

On transforme des cellules E. Coli MC 1061 avec I'ADN recombinant 
obtenu precedemment par electroporation a I'aide de I'appareil Biorad Gene 
Pulser (Biorad) utilise a 2,5 kV dans les conditions prescrites par le fabricant, 
puis on fait pousser les bacteries pendant une heure dans du milieu dit milieu 
LB (Sambrook op cite) de composition : bactotryptone 10 g/l ; extrait de levure 5 
g/l ; NaCI 10 g/l. 

On determine le nombre de clones independants en etalant une dilution au 
1/1000eme de la transformation apres la premiere heure d'incubation sur une 
boite de milieu LB additionne de 1,5 % d'agar (p/v) et de 100 \ig/m\ 
d'ampicilline, appele par la suite milieu LB gelose. Le nombre de clones 
independants est de 1 million. 

j) Analyse des ADNc de la banque 

Dans le cadre de I'analyse de clones individualises de la banque par un 
sequencage nucleique du 5' des ADNc, un clone, denomme SR-p70a s'est 
revele presenter une homologie partielle avec I'ADNc de la proteine deja 
connue. la proteine p53 (Genbank X 02469 et X 16384) (Figure 1). Les 
sequences ont ete realisees avec le kit United States Biochemical (reference 
70770) et/ou le kit Applied Biosystems (references 401434 et/ou 401628) qui 
utiUsentJa methode de Sanger et al., Proc. Natl. Acad. Sci. USA ; 1977, 14, 
5463-5467. L'ADN plasmidique est prepare a partir du kit WIZARD mini 
preparation (Promega reference A7510). Les amorces utilisees sont des 
oligonucleotides de 16 a 22 mer, complementaires soit au-vecteur pSE1 dans la 
region immediatement en 5' de I'ADNc, soit a la sequence de TADNc. 

Un second ADNc a ete isole a partir de la meme banque en criblant de 
maniere similaire a la technique decrite dans I'EXEMPLE III 3) ci-apres avec un 
fragment de I'ADN SR-p70a a marque au 32 P avec le kit BRL "Random 
Primers DNA labelling systems" (reference 18187-013). Le tampon 
d'hybridation et de lavage sont additionnes de 50 % de formamide. Le "dernier 
lavage est realise en 0.1 x SSC/SDS 0,1 % a 60'C. Cette seconde sequence 
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(ADNc SR-p70b) est identique a la premiere mais presente un fragment interne 
delete (Figure 3). 

Les deux ADNc SR-p70, d'une longueur de 2874 nucleotides (SR-p70a) et 
de 2780 nucleotides (SR-p70b) correspondent aux produits d'un seul gene, un 
epissage altematif entrainant une deletion de 94 bases entre les nucleotides 
1637 et 1732 et une terminaison prematuree de la proteine codee 
correspondante. Les proteines deduites des deux ADNc presenter* 
respectivement 637 acides amines et 499 acides amines (Figures 4 et 5). 

EXEMPLE II 

Obtention de la sequence et clonage de I'ADNc de la proteine SR-p70 a 
partir de cellules HT-29 (Adenocarcinoma de colon humain). 

1) Culture des cellules HT-29 

Les cellules sont cultivees en milieu Mac Coy 5 (GIBCO 26600-023) 
additionne de 10 % de serum foetal de veau (GIBCO 10081-23) et 50 mg/l de 
gentamycine jusqu'a semi-confluence. 

2) Preparation de I'ADN complementaire 

L'ARN messager est prepare comme decrit dans I'EXEMPLE 1. 2. L'ADNc 
est prepare de maniere similaire a celle decrite dans I'EXEMPLE 1. 3 avec 5 \ig 
d'ARN messager total en utilisant une amorce poly(T) 12 . La reaction n'est pas 
interrompue avec de I'EDTA. 

3) Amplification specif ique de I'ADNc humain par la technique dite de PCR 
La polymerisation est realisee avec 4 ul d'ADNc dans 50 \i\ final avec le 

tampon de composition suivante : Tris HCI 10 mM pH 8,3, MgCI 2 2,5 mM ( KCI 
50 mM en presence de 10 % DMSO, dNTP 0,5 mM, 4 ug/rnl de chacune des 
deux amorces nucleiques et de 2,5 unites de TAQ ADN polymerase 
(Boehringer). Les couples d'amorces ont ete choisis sur la sequence nucleique 
du clone SR-p70 de COS-3, notamment en amont de I'ATG d'initiation et en 
aval du TGA d'arret de traduction et sont de compositions suivantes : 

amorce sens : ACT GGT ACC GCG AGC TGC CCT CGG AG 
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site de restriction Kpn I 



amorce antisens : GAC TCTAGA GGT TCT GCA GGT GAC TCA G 
site de restriction Xba I 

La reaction est realisee durant 30 cycles 94°C/1 minute. 54-60°C/1 minute 
30 secondes et 72*C/1 minute 30 secondes, suivi d'un dernier cycle de 72°C/6 
minutes. 

4) Obtention de la sequence de I'ADNc humain 

Dans un premier temps, le produit de PCR est elimine des oligonucleotides 
sur une colonne de sephacryl S400 puis dessale par chromatographie 
d'exclusion sur une colonne de polyacrylamide P10 (Biorad reference 1504144). 
Les reactions de sequencage sont realisees a I'aide du kit Applied Biosystems 
(reference 401628) avec des oligonucleotides specifiques de I'ADNc. La 
sequence obtenue est tres similaire a celle du SR-p70a de singe et la proteine 
deduite contient 636 acides amines (Figure 6). 

De maniere similaire. d'autres sequences issues de lignees ou de tissus 
humain ont ete obtenues pour la partie codante du SR-p70 humain. notamment 
a partir du poumon ou du pancreas. Les proteines deduites de ces sequences 
sont identiques a celles obtenues pour la lignee HT-29. 

5) Clonage de I'ADNc humain dans le plasmide pCDNA3 (Pharmacia) 

'\ Le produit PCR obtenu en 3) ainsi que le plasmide sont digeres par les 
deux enzymes de restriction Kpn I et Xba I puis purifies apres migration sur un 
gel d'agarose 1 % a I'aide du kit geen clean (Bio 101 reference 3105). Apres 
ligation avec 100 ng d'insert et 10 ng de vecteur et transformation (technique 
decrite dans I'EXEMPLE I 3)g) et i). les clones recombinants sont verifies par 
sequengage a I'aide du kit Applied Biosystems cite ci-dessus. 
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EXEMPLE III 

Clonage -de I'ADNc du SR-p70 de souris a partir de cellules AtT-20 
(tumeur hypophysaire) 

1) Culture cellulaire de la lignee AtT-20 

Les cellules sont cultivees dans du milieu Ham F10 (GIBCO 31550-023) 
additionne de 15 % de serum de cheval (GIBCO 26050-047) et de 2,5 % de 
serum foetal de veau (GIBCO 10081-073) et de 50 mg/l de gentamycine 
jusqu'a semi-confluence. 

2) Preparation de la banque d'ADN complementaire 

La banque est realisee comme decrit dans I'EXEMPLE I, II et III a partir des 
cellules cultivees ci-dessus. 

3) Criblage de la banque 

a) Preparation des membranes 

Les clones de la banque sont etales sur du milieu LB gelose (boites de petri 
diametre 150) revetu de membranes Biodyne A ( PALL reference BNNG 132). 
Apres une nuit a 37 # C, les clones sont transferes par contact sur de nouvelles 
membranes. Ces dernieres sont traitees en les deposant sur du papier 
Wathman 3 MM imbibe des solutions suivantes : NaOH 0.5 N, NaCI 1.5 M 
pendant 5 minutes puis Tris HCI 0.5 M pH 8 , NaCI 1.5 M pendant 5 minutes. 
Apres un traitement a la proteinase K dans le tampon suivant : Tris HCI 10 mM 
pH§ t EDTA 10 mM, NaCI 50 mM, SDS 0.1 %, proteinase K 100 //g/ml pendant 
une heure a temperature ambiante, les membranes sont lavees abondamment 
dans du 2 x SSC (sodium citrate NaCI), sechees, puis incubees au four sous 
vide a 80*C pendant 20 minutes. 

b) Preparation de la sonde 

Sur la base de sequences des ADNc SR-p70 de singe et d'humain, une 
premiere sequence a ete realisee sur un fragment amplifie a partir de I'ARNm 
de la lignee AtT-20 comme decrit dans I'EXEMPLE II 3) et 4) avec les 
oligomeres de compositions suivantes : 

amorce sens : GCC ATG CCT GTC TAC AAG 

amorce antisens : ACC AGC TGG TTG ACG GAG 
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Sur la base de cette sequence, une sonde oligomerique specifique de 
souris a ete choisie et presente la composition suivante : 
GAG CAT GTG ACC GAC ATT G. 

100 ng de la sonde sont marques en 3' avec 10 unites de Terminal 
Transferase (Pharmacia) et 100 fuC\ de dCTP a^P 3000 Ci/mmole (Amersham 
reference PB 10205) dans 10 fj\ du tampon suivant : Tris HCI 30 mM pH 7.6 , 
acide cacodylique 140 mM, CoCI 2 1 mM, DTT 0.1 mM pendant 15 minutes a 
37*C. Les nucleotides radiomarques non incorpores sont elimines sur une 
colonne de poly aery lam id e P10 (Biorad. reference 1504144). La sonde obtenue 
a une activite specifique environ de 5.1 0 8 dpm//jg. 

c) Prehybridation et hybridation 

Les membranes preparees en a) sont prehybridees 30 minutes a 42*C dans 
6 x SSC, 5 x Denhart's, 0,1 % SDS puis hybridees quelques heures dans le 
meme tampon additionne de la sonde preparee en b) a raison de 10 6 dpm/ml. 

d) Lavage et exposition des membranes 

Les membranes sont lavees deux fois a temperature ambiante dans le 
tampon 2 x SSC/SDS 0.1 % puis une heure a 56*C en 6 x SSC/SDS 0.1 %. 
Les clones hybrides sont reveles avec des films KODAK XOMAT. Un clone 
positif contenant le SR-p70 de souris est selectionne et denomme ci-apres 
SR-p70c. 

4) Sequengage du SR-p70 de souris et analyse de la sequence 
'"-.La sequence est obtenue a I'aide du kit Applied Biosystem (reference 
401628). La sequence proteique deduite de I'ADNc SR-p70c de souris (Figure 
7) presente une tres forte homologie avec celles de I'humain et de singe 
excepte dans la partie N terminate qui diverge fortement (voir Figure 9). A I'aide 
de la technique dite de PCR, de maniere similaire .a celle decrite dans 
I'EXEMPLE II, 3) et 4), une seconde sequence 5' (issue de la meme banque 
AtT-20) a ete obtenue (Figure 8). La sequence proteique N terminale deduite 
(sequence denomme SR-p70a) est tres similaire a celle deduite des ADNc 
SR-p70 humain et de singe (SR-p70a) (Figure 9). La lignee AtT-20 presente 
done au moins deux transcripts SR-p70. Ces 2 derniers divergent dans la 
partie N terminale par des epissages differents. 
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EXEMPLE IV 

1) Production de proteine recombinante SR-p70 dans E. coli 
a) Construction du plasmide d' expression 

Elle consiste a mettre la partie -COOH terminale de la proteine SR-p70a 
de singe, depuis la valine en position 427 a I'histidine -COOH terminale en 
position 637, en fusion avec la glutathione S-transferase (GST) du vecteur 
plasmidique pGEX-4T-3 (Pharmacia reference 27-4583). Pour cela, I'insert 
correspondant de la SR- P 70a (position 1434 a 2066) a ete amplifie par PCR 
avec 10 ng de plasmide contenant I'ADNc SR-p70a de singe. Les amorces 
nucleiques sont de composition suivante : 

amorce sens : TTT GGA TCC GTC AAC CAG CTG GTG GGC CAG 
site de restriction BamHI 

amorce antisens : AAA GTC GAC GTG GAT CTC GGC CTC C 
site Sal I 

Le fragment obtenu ainsi que le vecteur sont digeres par les enzymes de 
restriction BamHI et Sal I et le clonage est realise comme decrit dans 
I'EXEMPLE II 5). Le clone selectionne est appele pG SR-p70. 

b) Expression et purification de la proteine fusion GST-pSR-p70 
"\Cette etape a ete realisee -en utilisant le kit "bulk GST- purification module" 
(Pharmacia Reference 27-4570-01). 

r De maniere schematique, le clone recombinant a ete mis en culture a 37° 
C dans un litre de milieu 2x YTA + ampicilline 100 ng/ml. A DO 0.8, I'expression 
est induite avec 0,5 mM d'IPTG pendant 2 heures a 37°C, Apres centrifugation, 
le culot cellulaire est repris dans du PBS froid puis sonique par ultrason. Apres 
adjonction de 1 % triton X-100, on incube 30 minutes sous agitation a 
temperature ambiante. Apres centrifugation a 12 000 g, 10 minutes a 4°C, on 
recupere le sumageant. La purification est ensuite realisee sur une colonne de 
chromatographie d'affinite glutathion sepharose 4B. La fixation et le lavage sont 
"realisees en tampon PBS et relation est realisee par competition avec du 
glutathion reduit. La concentration finale est amenee a 300 ng/ml de proteine 
fusion. 
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2) Production de proteine SR-p70a dans les cellules COS-3. 

Les cellules COS-3 sont transferees avec de I'ADN plasmidique pSE1 
dans lequel a ete clone I'ADNc de SR-p70a de singe (EXEMPLE I 1)) ou avec 
de I'ADN plasmidique du vecteur PSE1 en tant que temoin par la technique du 
DEAE Dextran : les cellules COS-3 sont ensemencees a 5 x 1 0 5 cellules par 
boite de 6 cm en milieu de culture contenant 5 % de serum de bovin foetal 
(EXEMPLE I 1)). Apres culture, les cellules sont rincees avec du PBS. On 
ajoute 1 ml du melange suivant : milieu contenant 6,5 /ig d'ADN, 250 vg/m\ de 
DEAE Dextran et 100 pM de chlon&quine. Les cellules sont incubees a 37*C en 
5 % CO2 durant 4 a 5 heures. LB milieu est aspire, on ajoute 2 ml de PBS 
additionne de 10 % DMSO et les cellules sont incubees pendant une minute en 
remuant legerement les boites. Li milieu est a nouveau aspire et les cellules 
sont rincees deux fois avec du PBS. Les cellules sont alors incubees a 37*C 
avec du milieu contenant 2 % de serum de bovin foetal pendant la duree de 
I'expression qui est generalement de 3 jours. 

La proteine SR-p70a est alors anatysee comme decrit dans I'EXEMPLE VI 
par immunoempreinte. 

EXEMPLE V 

Preparation d'anticorps specifiques z 

^150.|.ig de proteines de Techantillon prepare selon I'EXEMPLE IV ont ete 
utilises pour immuniser un lapin (male de 1,5 a 2 kg environ, New-Zealand). 
Les immunisations ont ete effectuees tous les 1 5 jours selon le protocole decrit 
par Vaitukaitis, Methods in Enzymology, 1981, 73, 46. Pour la premiere 
injection, un volume de solution antigenique est emulsifie par un volume 
d'adjuvant complet de Freund (Sigma reference 4258). Cinq rappels ont ete 
administres en adjuvant incomplet de Freund (Sigma reference 5506). 

EXEMPLE VI 

Detection de la proteine SR-p70 "Western immunoblotting" (immunoem- 
preinte) 
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1) Materiels utilises pour I'immunoempreinte 

a) Lignees cellulaires utilisees pour I'immunoempreinte. 

Les lignees cellulaires suivantes ont ete cultivees, comme decrit dans le 
catalogue "catalogue of cell lines snd hybridomas, 7 th edition, 1992 de I'ATCC 
(American Type Culture Collection) : COS-3, CV-1 (lignee de cellules de rein 
de singe), HT-29 ( U-373MG (glioblastome humain), MCF7 (adenocarcinome 
mammaire humain), SKNAS (neuroblasme humain cultive dans les memes 
conditions que COS-3), SK-N-MC (neuroblastome humain), IMR-32 
(neuroblastome humain), CHP212 (neuroblastome humain cultive dans les 
memes conditions que CV-1), Saos-2 (osteosarcome), SK-OV-3 
(adenocarcinome d'ovaire) et SW480 (adenocarcinome de colon humain). 

b) Cellules COS-3 transfect*e» par lADNc SR-p70a. 

Les cellules COS-3 ont ete transfectees comme decrit dans I'EXEMPLE IV 
2). En tant que temoin, les cellules ont ete transfectees avec de I'ADN 
plasmidique PSE1 ne contenant pas I'ADNc recombinant SR-p70a. 

2) Preparation des echantillons proteiques a partir de culture cellulaire 
eucaryote ou de cellules transfectees. 

Apres culture, les cellules sont lavees avec du PBS puis reprises dans un 
tampon RIPA (PBS avec 1 % NP40, 0,5 % sodium deoxycholate, 0,5 % SDS) 
complements avec 10 ug/ml RNAse A, 20,ug/ml DNAse 1, 2 ng/ml aprotinine, 
0,5 ^ig/ml leupeptine, 0,7 ug/ml pepstatine et 170 ug/ml PMSF. Les cellules 
sont soniquees par ultrason -a 4°C et laissees 30 minutes a 4°C. Apres 
microcentrifugation a 12 000 rpm, on recupere le surnageant. La concentration 
de proteine est mesuree par la methode de Bradford. __ 

3) "Western blotting" 

5 ou 50 ug de proteines (50 ^g pour les lignees cellulaires et 5 fjg pour des 
cellules transfectees) sont mis dans 0,2 volume du tampon d'electrophorese 6X 
suivant : Tris HCI 0,35 mM pH 6,8 10,3 % SDS, 36 % glycerol, 0,6 mM DTT, 
0,012 % bleu de bromophenol. Les echantillons sont deposes et mis a migrer 
dans un gel SDS-Page 10 % (30/0,8 Bis) puis electrotransferes sur une 
membrane de nitrocellulose/ ~ 

4) Revelation par I'anticorps 
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La membrane est incubee 30 minutes dans le tampon de blocage TBST 
(Tris HCI 10 mM pH 8, NaCI 150 mM, 0.2 % Tween 20) additionne de 5 % de 
lait (GIBCO- SKIM MILK) a temperature ambiante. La membrane est succes- 
sivement mise en presence de I'anticorps anti-SR-p70 (aSR-p70) dans le 
meme tampon 16 heures a 4°C, lavee 3 fois pendant 10 minutes avec du 
TBST, puis incubee une heure a 37°C avec un second anticorps anti- 
immunoglobulins de lapin couple avec de la peroxydase (SIGMA A055). Apres 
trois lavages de 15 minutes, la revelation est effectuee en utilisant le kit ECL 
(Amersham RPN2106) par chimioluminescence. 

Parallelement, les memes echantillons ont ete reveles par un anticorps 
anti-P53 (ap53) (sigma BP5312) suivi d'un second anticorps anti- 
immunoglobine de souris. 

5) Figure et resultat. 

Figure 10 : Immunoempreinte de la proteine SR-p70 

Figure 10a : Detection de la proteine recombinante SR-p70 

- colonnes 1 et 3 : COS-3 transfectee par le vecteur pSE-1. 

- colonnes 2 et 4 : COS-3 transfectee par le plasmide pSE1 contenant 

I'ADNc du SR-p70a. 

- colonnes 1 et 2 : Revelation par I'anticorps anti-SR-p70 (aSR-p70). 

- colonnes 3 et 4 : Revelation par I'anticorps anti-P53 (ap53). .. 
"~ Figure 10b : Detection de la proteine endogene SR-p70 

' colonnes 1 : COS-3 ; 2 : CV-1 ; 3 : HT-29 ; 4 : U-373 MG ; 5 : MCF7 ; 6 
: SKNAS ; 7 : SK-N-MC ; 8 : IMR-32 ; 9 : CHP212 ; 10 : Saos-2 ; 11 : SK- 
OV-3 et 1 2 : SW480. 

A : Revelation par I'anticorps aSR-p70 

B : Revelation par I'anticorps ap53 

L'anticorps aSR-p70 reconnait specifiquement les proteines recombinantes 
(Figure 10a) et endogenes (Figure 10b) et ne croise pas avec la p53. L'analyse 
, de lignees cellulaires humaines ou de singe montre que la proteine SR-p70 
. comme la p53 est generalement faiblement detectable. Par contre, lorsqu'une 
accumulation de p53 existe, la SR-p70 devient elle aussi plus facilement 
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detectable (Figure 10b). Une etude par RT-PCR de la distribution des transcrits 
SR-p70 montre que le gene est exprime dans tous les types cellulaires testes. 

EXEMPLE VII 

5 

Clonage du gene du SR-p70 et localisation chromosomique. 

1) Clonage du gene SR-p70 

La banque utilisee est une banque de cosmides, preparee avec de I'ADN 
10 genomique humain purifie de placenta, et commercialisee par Stratagene 

(reference 95 1202). 

Le criblage du gene est realise comme decrit dans I'exemple III 3) avec un 
fragment d'ADN SR-p70 marque au 32 p avec le kit BRL "Random Primers 
DNA Labelling Systems" (reference 18187-013). Les tampons d'hybridation et 
15 de lavage sont additionnes de 50 % formamide. Le dernier lavage est realise en 

0,1 x SSC/SDS 0,1 % a 60*C. De maniere similaire, le gene SR-p70 a ete isole 
a partir d'une banque preparee avec de I'ADN genomique de la souris black 
C57. 

20 Une analyse et un sequencage partiel des clones mettent en evidence la 

presence d'un minimum de 12 exons avec une structure rappelant cetle du 
gene p53. 

"~_2) Localisation chromosomique du gene SR-p70 chez I'homme 
25 E ne a ete realisee avec de I'ADN du gene SR-70 hurnain en utilisant la 

technique decrite par R. Slim et al.. Hum. Genet.. 1991, 88, 21-26. Cinquante 
mitoses ont ete analysees dont plus de 80% avaient des doubles spots 
localises en 1p36 sur les deux chromosomes et plus particulierement en 1p36.2 
-1p36.3 (Figure 11). L'identification du chromosome 1 et son orientation sont 
30 basees sur I'heterochromatine de la constriction secondaire. Les images ont ete 

faites sur un microscope Zeiss Axiophot, saisies par une camera CCD refroidie 
LHESA et traitees par Optilab. 



35 • * 
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L'homologie de structure entre le domaine de fixation a I'ADN de la p53 et 
la region centrale de la proteine SR-p70 permet d'inferer que la SR-p70 est un 
facteur de transcription (cf. figure 1 et 2). En effet. la p53 (393 acides amines) 
est constitute de plusieurs domaines fonctionnels. La region N-terminale (1-91 
acides amines) est impliquee dans I'activation de la transcription, et contient 
des sites d'interaction a differentes proteines cellulaires et virales. La partie 
centrale (acides amines 92 a 292) permet la fixation aux sequences d'ADN 
specifiques situes dans les regions prornotrices de certains genes (la majorite 
des mutations ponctuelles inactivant la p53 sont localisees dans cette region), 
elle presente egalement de nombreux sites d'interaction avec des proteines 
virales qui inhibent son activite. Enfin. les 100 derniers acides amines de la p53 
sont responsables de son oligomerisation ainsi que de la regulation de celle-ci 
(Hainaut P., Current Opinion in Oncology, 1995. 7, 76-82 ; Prokocimer M., 
Blood, 1994, 84rf8, 2391-2411). 

L'homologie de sequence entre P53 et SR-p70 est significative 
notamment en ce qui concerne les acides amines impliques directement dans 
I'interaction a I'ADN suggerant que la SR-p70 se fixe aux sites p53 sur I'ADN. 
Ces acides amines correspondent tres exactement a ce qu'on appelle les "hot 
spot", acides amines frequemment mutes dans les tumeurs humaines (SWISS 
PROT : SW : P53_human et Prokocimer M., Blood, 1994, 84 rf8, 2391-2411). 
De cette homologie, on peut deduire que la proteine SR-p70 exerce un controle 
sur I'activite des genes regules par la p53, soit independamment de celle-ci soit 
en formant des heterooligomeres avec cette derniere. 

'_En consequence, a I'instarde la p53, les produits du gene SR-p70 doivent 
etre impliques dans le controle et la regulation du cycle cellulaire provoquant 
des arrets du cycle (momentanes ou definitifs). et la mise en oeuvre de 
programmes tels que : la reparation de I'ADN. la differenciation ou la mort 
cellulaire. L'existence d'activites "p53-like" avait ete fortement pressentie avec 
la mise en evidence chez les souris p53"/-, d'activites de reparation de I'ADN 
et de mort cellulaire en reponse aux radiations ionisantes (Strasser. et al.. Cell. 
1994, 79, 329-339). Les auteurs de la presente invention ont localise le gene 
SR-p70 humain dans la region telomerique du bras court du chromosome 1, 
precisement en 1p36.2-36.3 . la plus petite region deletee (SRO) commune a 
" une majorite de neuroblastomes et d'autres types de tumeurs (melanomes et 
carcinomes) (White et al., PNAS. 1995, 92, 5520-5524). Cette region de perte 
d'heterozygotie (LOH) delirnite le locus d'un gene suppresseur de tumeur dont 
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la perte d'activite serait la cause de la formation des tumeurs. II est important 
de rappeler que cette region est egalement sujette a 'Tempreinte maternelle" ; 
I'allele maternel est preferentiellement perdu dans les neuroblastomes 
presentant la deletion 1p36 (sans amplification de N-Myc) (Caron et al., Hum. 
Mol. Gen., 1995, 4, 535-539). Le gene sauvage SR-p70 introduit et exprime 
dans des cellules de neuroblastome permet la reversion de leur transformation- 
La perte de cette activite anti-oncogenique est done associee au 
developpement de la tumeur. La region 1p36 presente une homologie 
syntenique avec le segment distal du chromosome 4 de souris, Dans cette 
region a ete localisee le gene curly tail (ct) (Beier et al., Mammalian Genome, 
1995, 6 % 269-272) implique dans les malformations congenitales du tube 
neural (MTN : spida bifida, anencephalie...). La souris ct est le meilleur modele 
animal d'etude de ces malformations. II est admis que ces malformations 
resultent d'anomalies de la proliferation cellulaire. Compte tenu de la nature du 
gene SR-p70 et de sa localisation chromosomique, une des hypotheses est 
que le SR-p70 pourrait etre Thomologue humain de ct et qu'a ce titre, la 
detection des mutations precoces et les anomalies chromosomiques 
concernant ce gene devraient permettre par exemple comme application, 
Identification des personnes a risques (0,5-1 % des nouveaux-nes atteints par 
MTN), et la mise en oeuvre de traitements preventifs (Neumann et al., Nature 
Genetics, 1994, 6, 357-362 ; Di Vinci et al., Int. J. Cancer, 1994, 59, 422-426 ; 
Moll et al., PNAS, 1995, 92, 4407-4411 ; Chen et al., Development, 1995, 121 1 
681-691). 
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LISTE DES SEQUENCES 



( 1 ) INFORMATION GENERALE : 

(i) DEPOSANT : 

(A) NOM : SANOFI 

(B) RUE : 32/34 rue MARBEUF 

(C) VILLE : PARIS 

(E) PAYS : FRANCE 

(F) CODE POSTAL : 75008 



( ii ) TITRE DE L' INVENTION : Proteine SR p70 



(iii) NOMBRE DE SEQUENCES : 16 

(iv) FORME LISIBLE PAR ORDINATEUR : 

(A) TYPE DE SUPPORT : Floppy disk 

(B) ORDINATEUR IBM PC compatible 

(C) SYSTEME D 1 EXPLOITATION : PC-DOS/MS-DOS 

(D) LOGICIEL : Patentln Release #1.0, Version #1.25 

(OEB) 



(2) INFORMATION POUR LA SEQUENCE No 1 : 

( i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 2874 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION : lineaire 

( ii TYPE DE MOLECULE : ADNc 

(vi) ORIGINE : 

r (A) l ORGANISME : singe 

(ix) CARACTERISTIQUE ADDITIONNELLE : 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT : 154.. 2064 

(xi) DESCRIPTION DE LA SEQUENCE No 1 : 
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51 ACGCAGCGAA GCCGGGOCCC GCGCCAGGCC CGCCGGGACC- GACGCCGA7G 
101 CCCGGAGC7G CGACGGC7GC AGAGCGAGCT CCGC7CGGAG GCCGG7G7GA 
151 GGAAG AT CGC CCAG7CCACC ACCACCTCCC CCGA7GGGGG CACCACGTT7 
201 GAGCACC7CT GGAGCTC7CT GGAACCAGAC AGCACCTACT 7CGACC77CC 
251 CCAC7CAAGC COGGGGAA7A A7GAGG7GC7 GGGTGGCACG GA77CCAGCA 
301 7GCACG7C77 CCACC7AGAG GGCA7GACCA CA7C7G7CAT GGCCCAG77C 
351 AATTTGC7GA CCACCACCA7 GCACCACA7G AGCAGCCGCG C7GCC7CGGC 
401 CAGCCCGTAC ACCCCGGAGC ACGCCGCCAG CG7GCCCACC CA77CACCC7 
451 ACGCACAGCC CAGC7CCACC TTCGACACCA 7C7CGCCCGC GCC7G7CA7C 
501 CCC7CCAACA CCGAC7A7CC CGGACCCCAC CAC7TCGAGG TCACTTTCCA 
551 GCAGTCCAGC ACGCCCAAG7 CAGCCACCTG G ACGT ACTC C CCACTCTTGA 
601 AGAAACTCTA CTGCCAGA7C GCCAAGACAT GCCCCATCCA GA7CAAGG7G 
651 TCCGCCCCAC CGCCCCCGGG CACCGCCATC CGGGCCATGC C7G7C7ACAA 
701 GAAGGCGGAG CACGTGACCG ACA7CG7GAA GCGCTGCCCC AACCACGAGC 
751 7CGCGAGGGA C7TCAACGAA GCACAGTC7G CCCCAGCCAG CCACC7CA7C 
301 CG7G7GGAAG GCAATAATC? C7CGCAG7A7 G7GGACGACC C7G7CACCGG 
851 CAGGCAGAGC G7CG7GG7GC CCTATGAGCC AC Z AC AGG TG GGGACAGAAT 
901 TCACCACCA? CCTGTACAAC 77CA7C7C7A ACAGCAGC7G TGTGGGGGGC 
951 ATGAACCGAC GGCCCA7CC7 CA7CA7CA7C ACCCTC-GAGA CGCGGGATGG 
1001 GCAGCTGCTG GGCCGCCGG7 CC7TCCACGG CCGCATCTGC GCCTGTCCTG 
10 51 GCCGCGACCG AAAAGCCGA7 CAGGACCAC7 ACCGGGAGCA GCAGGCC7TG 
1101 AATGAGAGCT CCGCCAAGAA CGGGGC7GCC AGCAAGCGCG CCTTCAAGCA 
1151 CAG7CCCCC7 CCCG7CCCCG CCC7GGGCCC GGG7G7GAAG AAGCGGCGGC 
12C1 ACSGAGACGA GGACACG7AC 7ACC7GCAGG TGCGAGCCCC CG AG AAC77C 
1251 GAGA7CC7GA TCAAGC7GAA GGAGAGCC7G GAGC7GATGG AG7TGG7GCC 
130 1 GCACCCGC7G G7AGAC7CC7 A7CGGCAGCA CCACCAGC7C C7ACAGAGGC 
13 51 CGAG7CACC7 ACACCCCCCA 7CC7ACGGGC CGG7C CTC7C GCCCATGAAC 
1401 AAGG7GCACG GCGCCG7GAA CAAGCTGCCC 7CCG7CAACC AGCTGGTGGG _ 
1451 CCAGCC7CCC CCGCACAGC7 CGGCAGCTAC ACCCAACCTG GCACC7G7GG 
1501 GC7C7GGGAT GC7CAACAAC CACGGCCACG CAGTGCCAGC CAACAGCGAG 
1551 ATGACCAGCA GCCACGGCAC CCAGTCCATG GTCTCGGGGT CCCACTCCAC 
1601 TCCGCCACCC CCCTACCACG CCGACCCCAC CCTCGTCAGT TTTTTAACAG 

16 51 GATTGGGGTG TCCAAACTGC ATCGAGTATT TCACGTCCCA GCCCTTACAG 

17 01 AGCATTTACC ACCTGCACAA CCTGACCATC GAGGACCTGG GGGCCCTCAA 
/ *17S1 CATCCCCGAC CAGTATCGCA TGACCATCTC GCGGGGCCTG CACGACCTOX 

1801 AGCAGGGCCA CCAC7ACGGC GCCGCCGCGC AGCAGCTOCT CCGCTCCACC 
1851 AACGCGGCCG CCATTTCCAT CGGCOGCTCC GGGGAGCTGC ACCGCCACCC 
1901 GGTCATCGAG GCCGTCCACT TCCGCGTGCG CCACACCATC ACCATCCCCA 
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19 51 ACCGCGGCGG CCCCGGCGCC GGCCCCGACG AG7GGGCGGA CTTCGGCTTC 

2C01 GACCTGCCCG AC7GCAAGGC CCGCAAGCAG CCCA7CAAGG AGGAG77CAC 

20 5 L GGAGGCCGAG A7CCAC7GAG GGGCCGGGCC CAGCCAGAGC CTGTGCCACC 

2 1 :i GCCCAGAGAC CCAGGCCGCC 7CGCTC7CC7 TCC7G7S7CC AAAACTGCCT 

2151 CCGQACGC:--Z GGCCTCGAGG CTG7GCCCGG GG AAAGGC AA GG7CCGGCCC 

2 201 A7GCCCCGGC ACC7CACCGG CCCCAGGAGA GGCGIAGCCA CCAAAGCCGC 

2 2 51 C7GCGGACAG CCTGAGTCAC CTGCAGAACC 77C7GGAGC7 GCCCTAATGC 

2 3 CI TGGGCTTGCG GGGCAGGGGC CGGCCCAC7C TCAGCCCTGC CACTGCCGGG 

2351 CGTGCTCCAT GGCAGGCG7G GGTGGGGACC GCAG7GTCAG CTCCGACCTC 

2 401 CAGGCCTCAT CCTAGAGACT CTGTCATCTG CCGACCAAGC AAGGTCGTTC 

2 451 CAGAGGAAAG AA7CC7CT7C GC7GG7GGAC TGCCAAAAAG 7A7777GCGA 

2 501 CATCTTTTGG TTCTGGAGAG TGGTGAGCAG CCAAGCGAC7 GTGTCTGAAA 

2 551 CACCGTGCAT T77CAGGGAA 7GTCCC7AAC GGGCTGGGGA CTCTCTCTGC 

2 501 TGGACTTGGG AGTGGCCTTT GCCCCCAGCA CAC7G7A77C TGCGGGACCG 

2 551 CCTCC7TCCT GCCCCTAACA ACCACCAAAG 7G77GC7GAA A77GGAGAAA 

2701 AC 7GGGG AAG GCGCAACCCC 7CCCAGG7GC GGGAAGCATC TGG7ACCGCC 

2751 7CGGCCAG7G CCCC7CAGCC 7GGCCACAG7 CACC7C7CC7 TGGGGAACCC 

2 30 1 TGGGCAGAAA GGGACAGCC7 G7CC77AGAG G AC 1 GG AAA7 7GTCAATATT 

2 35 1 7GATAAAA7G A7ACCG777T C7AC 




(2) INFORMATION POUR LA SEQ ID No 2 : 

(i) CARACTERIST IQUES DE LA SEQUENCE : 

(A) LONGUEUR : 637 acides amines 

(B) TYPE : acide amine 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : proteine 
(xi) DESCRIPTION DE LA SEQ ID No 2 : 

1 y_AQST7TS?D GGTTFEXL-WS SLEPDSTYrD L?QSSRGN>*E WGGTCSSIO 

51 VFKI.EGM7TS V^TNLwSS 7KTQMS3RAA SA5 PYTPEKA ASVPTKSPYA 

1C1 QPS5TFDTMS ?A?VI?SN7D YPGP5C-IFEVT FCQSSTAXSA TViTYSPLLKX 

151 LYCQIAX7C? IQIXVSAPP? PGTAIRAMPV YXXAEHVTDI VXRCPNKZ-G 

201 RDFNEGQSA? ASKLIP.YEGZJ N1.SQYVSCPV TGRQSWVPY EPPQVGTE77 

251 TIwYNrMCNS SCVCG:CK?.? ILIIITLSTa DGQVLCRRSF EGRZCACPGR 

301 DHXADSDKYR EQQA^NTSSA XXGAASKRA? XQSPPAVPAL G ?G VXXRP.KG 

351 DEDTYYLQVR GRSIrSZLMX LXZSLSLMSL VPQPLVDSYR QQQQLLQRP3 

401 KLQPPSYGPV LSPJCrC/HGG V*n<L?SVNQL VGQPPPKSSA ATPMLGPVG5 

451 GMLMNKGHAV PANSZ^SSK GTQSKV5GSH CT??PPYKAD PSLVSrLTGL 

501 GCPNCIZYTT SQGLQS ZYHL QNLTIEDLGA LKIPEQY-WT IWRGLQDLXQ 

551 GHDYGAAAQQ LLRSSXAAAI SrC-GSGSLQR QRVVCEAVKFR V7>KTIT:?N"R 

601 GGPGAGPDEW ASFGFSLPCC KARXQPIXEE FTZAEZH 
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(2) INFORMATION POUR LA SEQ ID No 3 : 

( i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 2034 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADNc 

(vi) ORIGINE : 

(A) ORGANISME : singe 

(ix) CARACTERI ST I QUE ADDITIONNELLE : 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT : 154.. 1650 



(xi) DESCRIPTION DE LA SEQUENCE No 3 
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1 TSCCTCC-CG C7CGCGCAC7 CGCCCCGAGG CC7G7GC7CC 7GCGAAGGC-C 
=1 ACGCAG7GAA GCCGGGGCCC GCGCCAGGCC GGCCGGGACG GACGCCGA7G 
101 C77GGAGC7G CGACGGCTGC AGAGCGACC7 GCCCTCGGAG GCCGG7G7GA 
151 CCAAGA7GGC CCAG77CAC7 ACCACCTCCC C7GA7GGGGG CAC7ACGTT7 
201 GAGCACC7C7 CGAGC7C7CT GGAACCAGAC ACCACC7ACT 7CGA7C77C7 
251 CCAGTCAAGC CGGGGC AA7 A A7GAGG7GC? GGGTGGCACG CA77CCAGCA 
301 7GGACG7CTT CCACC7AGAG GCCA7GACCA CA7CTGTCAT GGCCCAGTTC 
351 AA777GC7GA GCACCACCA7 GGACCAGA7G AGCAGCCGCG CTGCCTCGGC 
40 1 CAGC7CGTAC ACCCCGGAGC ACGCCGCCAG CG7GCCCACC CA7TCACCCT 
451 ACGCACAGCC CAGCTCCACC 77CGACACCA TGTCGCCCGC GCC7G7CATC 
501 CCC7CCAACA CCGACTATCC CGGACCCCAC CACTTCGAGG TCACTTTCCA 
551 GCAGTCCAGC ACGGCCAAGT CAGCCACGTG GACGTAC7CC CCAC7CTTGA 
501 AG AAAC7CTA C7CCCAGATC GCCAACACA7 CCC7CATCCA GA7CAAGGTG 
651 7C7GCCCCAC CGCGCCCGGG CACCGCCA7C CGGGCCATGC C7G7C7ACAA. 
701 GAAGGCGGAG CACG7GACCG ACATCGTGAA GCGCTGCCCC AACCACGAGC 
751 7CGGCAGGGA C7TCAACGAA GGACAG7CTG CCCCAGCCAG C7ACC7CA7C 
301 CG7G7GGAAC GC AA7 AA7 77 C7CGCAG7A7 G7GGACGACC C7G7CACCGG 
351 CAGGCAGAGC G7CG7GG7GC CC7A7GAGCC AC C AC AGG 7G GGGACAGAA7 
901 7CACCACCA7 CCTCTACAAC 77CA7G7G7A ACAGCAGC7G 7G7GGGGGGC 
951 ATGAACCGAC GGCC7A7C77 CA7CA7CA7C ACCC7GGACA CGCGGGATGG 
1001 GCAGGTGCTG GGCCGCCGG7 CC77CGAGGG CCGCA7C7GC CCC7GTCC7G 
1051 GC7GCGACCG AAAAGC C G AT GAGGACCACT ACCGGGAC-CA GCAGGCC7TG 
110 1 A-A7GAGAGC7 C C GC 7 AAG AA C7-GGGC7GC7 AGCAAGCGCG CC77CAAGCA 
115 1 GAG7CCC7C7 GCCG77777G C777GGGCCC GGG7G7GAAG AAGCGGCGGC 
120 1 ACSgAGACCA GGACACG7AC 7AC77GCAGG 7GCGAGGCCG CGAGAAC7TC 
125 1 GAGATCC7CA 7GAACC7GAA GGAGACCCTG GAGCTGA7GG AGTTGGTGCC 
1301 GCAGCCGC7G G7AGAC7CC7 A7CGGCAGCA GCAGCAGCTC CTACAGAGGC 
135 1 CCACT7ACCT ACAGC77C7A 7C77ACGGGC CGGTCCTCTC GCCCATGAAC 
1401 AAGG7GCACG GGGGCG7GAA CAAGC7GCCC TCCGTCAACC AGC7GGTGCG _ 
1451 C7AGC77CCC C7GCACAGC7 CGGCAGC7AC ACCCAACC7G GCACCTGTGG 
15 01 GCTCTGGCAT GCTCAACAAC CACGGCCACG CAGTGCCAGC CAACAGCGAG 
15 51 ATGACCAGCA GCCACGGCAC CCAGTCCATG GTCTCGGGGT CCCACTGCAC 
1601 TCCGCCACCC CCCTACCACG CCGACCCCAG CCTCGTCAGC ACCTGCGGGC 
1651 CC7GAAGA7C CCCGAGCAGT ATCGCATGAC CATCTGGCGG GGCCTGCAGG 
17 01 ACCTGAAGCA GGCCCACGAC TACGGCGCCG CCGCGCACCA GCTCCTCCGC 
* ^17 SI TCCAGCAACG CGGCCGCCAT TTCCATCGGC GGCTCCCGGG AGCTGCAGCC 
- 1301 CCAGCGGGTC ATGGACGCCG TGCACTTCCG CCTGCGCCAC ACCATCACCA 
1851 TCCCCAACCG CGGCGGCCCC GGCGCCGGCC CCGACGACTG GCCOGACTTC 
1901 GGCTTCCACC TGCCCCACTG CAAGGCCCGC AXGCACCCCA TCAAOGACGA 
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1351 GT7CACGGAG GG CO AG AT CC ACTGAGGGGC CGGGCCCAGC CAGAGCC7GT 
2001 GGCACCGCCC AGAGACCCAG GCCGGGTCGC TCTC 



i 
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(2) INFORMATION POUR LA SEQ ID No 4 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 49 9 acides amines 

(B) TYPE : acide amine 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : proteine 
(xi) DESCRIPTION DE LA SEQ ID No 4 : 



I y^OSTTTSPD GGTTrZKlWS SLEPDSTYTO WCC7DS5MD 

SI '/THLEG.MTTS VMAQFJILLSS TMT^MSSRAA SASJflfTPZKA A5VPTK5 PYA 

IC1 QPSSTrCT^S ?A?YI?SNTD V ?G ? KKFSV7 FQQSoTAXSA TVTY5PLL5CX 

15 1 lycqiaxtc? iqixvsa??? ?g7airam?v lrbuekvtdi vxrcpskelg 

201 ?^fn"qsa? ashlirvegm klsqyvddpv 7crqsvw?? s??qvgter? 

25 1 tiitmfmcms scvgg>£;?-?.? :*.iiitletr dcqvlg?j».s? eg 3. 1 c ac pgr 

30 : c=xa^e::ky?. ecqaln-essa xxgaasxsaf xqs>?av?al gpgvtcxrrkg 

35 1 wE^TYTLQV?. GRZN™:i^C< LKSSLEI-MEL V?Q?1VDS7R cccq-^Q^?s 

;0i HLQPPSYGPV L3?JCOT--:GG VN*XL?SV>JQL VCQ???KSSA AT?NT1G?YG3 

451 GMlN^rHGHAV PANSZM7S3H GTQSMVSGSK C7????YHAD PSLVRTWG? 
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m 



(2) INFORMATION POUR LA SEQ ID No 5 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 2156 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADNc 

(vi) ORIGINE : 

(A) ORGANISME : homme 

(ix) CARACTERISTIQUE ADDITIONNELLE : 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT : 33.-1940 

(xi) DESCRIPTION DE LA SEQUENCE No 5 : 



m m 

37 



51 ACCTCCCCTG ATGGGGGCAC CACGTTTGAG CACC7CTGGA GCTCTCTGGA 
101 AG G AG AG AG C ACCTACTTCG ACCTTGGCGA GTCAAGCCGG GGCAATAA7G 
151 AGGTGGTGGG cGGAACGGAT TGCAGGATGG AGGTCTTGCA CGTGGAGGCC 
201 AT GAG 7 AG AG CTGTCATGGC CCAGCCCAA7 CTGCTGAGCA GCAGGAGGGA 
25 1 CCAGATGAGC AGGGGGGGGG CCTCGGCCAG CCCCTACACC CCAGAGCACG 
301 CCGCCAGCGT CcCCACCCAe TCGCCCTACG CACAACCCAG C7CCACCTTC 
351 GACACCATGT CGCCGGCGCC TGTCATCCCC TCCAACACCG ACTACCCCGG 
401 ACCCCACCAC TCTCA.GCTCA CTTTCCAGCA GTCCAGCACC GC C AAG T C AG 
451 CCACGTGGAC GTACTCGCCG CTCTTGAAGA AACTGTACTG GGAGATCGGG 

501 AAGACATGCC CCA7CCAGAT CAAGC7GTCC ACCCCGCCAC CCCCAGGCAC 

551 TOO CATC COG GGCATGGGGG TTTACAAGAA AGCGGagcAC GTGACCGACG 

501 TCGTGAAACG CTGCCCCAAC CACGAGCTCG GCAGGGACTT CAACGAAGGA 

551 CAGTCTGCTC CAGcCAGCCA CCTCATCCGC GTGGAAGGCA ATAATCTCTC 

701 GC AG T AT G TG GATGACGCTG TCACCGGCAG GCAGAGCGTC GTGGTGCGCT 

751 ATGAGCCACG ACAGGTGGGG ACGCAA7TCA CCACCATCCT GTACAACTTC 

301 A.7 G T G T AAC A GCAGCTGTGT AGGCGGCATG AACGGGCGGC CCATCCTCAT 

351 CATCATCACC CTGGAGATGC GGGAGGGGCA GGTGCTGGGC CGCCGGTCCT 

901 TTGAGGGCCG CATCTGCGCG TGTCCTGGCC GCGACGGAAA AGCTGATGAG 

951 G ACT ACT ACT GGG AG C AG C A GGCGGTGAAC GAGAGCTCCG CCAAGAACGG 
1001 GGCGGCCAGC AAGCGTGCCT TCAAGCAGAG CCGCCCTGCC GTCcCCGCCC 
1051 TTGGTGCCGG TGTGAAGAAg CGGGGGGAGG GAGACGAGGA CACGTACTAC 
1101 CTTCAGGTGC GAGGCCGGGA GAAGTGTGAG ATGGTGATGA ACCTCAAAGA 

120 1 GGG. AG G AG G A CCACCTCGTA CAGAGCCCGA GTCACGTACA GCCCCCGTCC 

12 5 1 TAC^GGCCGG TGCTGTCGCG CATGAACAAG GTGCACGGGG GCATGAACAA 
1301 GCTGCCCTCC GTCAACCACC 7GC7GCCCCA GCCTCGGCCG CACAGTTCGG 

13 51 CAGCTACACC CAACGTGGGG CGGGTGGGCC CCCGCAGGcT CAACAACGAT 
1401 GGcCACGCAG TCcCACCCAa G GGG GAG AT G AGCACCAGCC ACAGCGCCCA " 
1451 GTCCATGGTC 7CGCGC7CCC ACTGcACTCC GCCACCCCGC TACCACGCCG 
1501 ACCCCAGCCT CGTCACTTTT TT AAC AGO AT TGGGGTGTCC AAACTGCATC 
1551 GAGTATTTCA CCTCCCAAGG GTTACAGAGC ATTTACCACC TgcACAACcT 
1601 GACcATTGAG GACCTCGGGG CCCTGAAGAT CCCCGAGCAC TACCGCATGA 
165^- CCATCTGGCG GGGCCTGCAC CACCTCAAGC AGGGCCACGA CTACAGCACC 

. 4.701 r GCGCAGCACC TGCTCCGCTC TAGCAACGCG GCCACCATCT CCATCGGCGG 
■ 1751 CTCAGGGGAA CTGCAGCGCC AGCGGGTCAT GGAGGCCGTG CACTTCCGCG 
1301 TGCGCCACAC CATCACCATC CCCAACCGCG GCGGCCCAGG CGGCGGCCCT 
. „ 1851 GACGACTGCC CGGACTTCGG CTTCGACCTG CCCGACTGCA AGGCCCGCAA v 
1901 GCAGCCCATC AAGGAGGAGT TCACGGACGC CGAGATCCAC TGACGGCCTC 



/ 




19 51 GCCTGGCTGC AGCCTGC3CC 

2001 TCCTTCCTGT G T OT CC AAAA 

2 051 GCCCGGGGAA AGGCAAGGTC 

2101 AGGAAAGGCC CAGCCACCGA 

2151 AGAACC 
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ACCGCCCAGA GACCCAAGCT GCCTCCCCTC 
CTGCCTCAGG AGGCAGGACC TTCGGGCTGT 
CGGCCCATCC CCAGGCACCT CACAGGCCCC 
AGCCGCC7G7 GGACAGCCTG AG7CACC7GC 




(2) INFORMATION POUR LA SEQ ID No 6 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 636 acides amines 

(B) TYPE : acide amine 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : proteine 



(xi) DESCRIPTION DE LA SEQ ID No 6 : 



1 MAQSTA7SPD GGTTFIKLWS SLE?CS?Y?D L?CS3RGN*NZ VYCGTZSSMD 

51 YTKLEG^TTTS Vyj^QENLOSS TMTCMS3RAA SA3PYTPEHA A5Y?7H3?YA 

101 QPSSTrDTMS PAPVIPSNTD YPGPKKrZVT FQQSSTAXSA TVTY3PLLXX 

151 LYCQIAX7C? IQIXVST??? ?GTAIRA>!?V YXXAZ KVT D V Vy.RC?::KELG 

20. ?~F:7ZGQSA? A3KLIRYEGN ^SQYVSDPV TGP.QSWVPY EPrQVGTEFT 

251 TILYNFMCN'S SCVGG^'RR ? ILIIZTLEyCR DGQVLGR3S? IGRIC AC PGR 

301 DPSJKDZDXTR EQQAI-.VESSA jC I G AA S K?*AF KQS??AV?A^ GAGYXXPilHG 

3 51 DEDTYYLQVR GR^frEIL>C< LI-CZSLEL-XZL VPQPLVDSYR. QCCQLLQRPS 

401 KLQPPSYGPV LSP^-CVXGG MNXL ? SVNQ L VGQ???H3SA AT ?N"T_G?VG? 

451 gml:i^-:gc-lav PANCZMSS3K 3AQSXVSGSH CTPPPPYHAD PSLVSFI/TGL 

501 GCPNCIEYFT SQGLQSIVHL QMITIZCLGA LXIPSQYRMT IVRGLQDLXQ 

551 GKDYSTAQQL LRSSNAATI3 IGG3GE-QRQ RVMZAVHFRV RHTITIPNHG 

501 GPGGGPDZVA DFCFGLPCCX ARXQPIXZE? TEAEIH 
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(2) INFORMATION POUR LA SEQ ID No 7 : 

(i) CARACTERISTIQUES DE LA SEQUENCE 

(A) LONGUEUR : 2040 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADNc 

(vi) ORIGINE : 

(A) ORGANISME : souris 

(ix) CARACTERIST IQUE ADDITIONNELLE : 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT : 124 ,.1890 



(xi) DESCRIPTION DE LA SEQUENCE No 7 
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1 7GA7C7CCt7 G7GG:t77CA GGGGAC7GAG CCAGGGAC7A GATGCCCTGA 
5 1 GACCCCAAGG GACAC7CAAG GAAACCT7SC 7GGCT7TGAG AAAGGGA7CG 

tctctctccg ggcc.-.-gaga agcatg7GTa tgggccctgg G7A7GAA7CC 

15 1 77G3GGCAGC CCCA3TTCA_\ 77TGC7CAGC AGTGCCATGG ACCAGA7GGG 
20: CAGCCG7GCG CCCCCGGCGA GCCCC7ACAC CCCGGAGCAC GGCGCCAGCG 
231 CGCCCACCCA C7CGC7::7AC GCGCAGCCCA GCTCCACCTT CGACACCA7G 
301 7C7CCGGCGC C7G7CA7CCC TTCCAA7ACC GACTACCCCG GCCCCCACCA 

3 51 CT7CGAGGTC ACCT7CCAGC AGTCGAGCAC TGCCAAGTCG GCCACCTGGA 
A 01 CATAC7CCCC AC7C77GAAG AAG7TGTACT G7CAGA77GC 7AAGACA7GC 

4 51 CC7A7CCAGA TCAAAG7G7C CACACCACCA CCCCCGGGCA CGGCCATCCG 

5 01 GGCCA7CCCT C7C7ACAAGA AGGC AG AGC A TG7GACCGAC ATTGT7AACC 
5 51 GC7GCCCCAA CCACGAGC7T CGAAGGGACT 7CAATGAAGG ACAGTCTGCC 
601 CCGGCTACCC ACCTCA7CCG TGTAGAAGGC AACAACCTCG CCCAGTACGT 
551 GGA7GACCC7 G7CACCGGAA GGC AG AGTGT GG77G7GCCG TA7GAACCGG 
701 CACAGG7GGG AACAGA.A7TT ACCACGA7CC TG7ACAAC7T CATGTGTAAC 
751 AGCAGG7G7G TGGC-GGGCAT GAATCGGAGC CCCATGCT7G TCA7CATCAC 
301 CC7GGAGAC7 CGGGA7GGAC AGGTCCTGGG CGGCCGG7G7 77GGAGGG7C 
351 GCATC7G7GC CTG7C77GGC CGTCACCGCA AAGC7GA7GA AG AC G ATT AC 
901 CGGGAGCAAC AGCC7C7GAA TGAAAGTACC ACCAAAAATG GAGCTGCCAG 
951 GAAACGTGCA 7T 7 AAG C AG A GCCCGCCTGC CA7CCC7GCC C7CGCTACCA 

10O1 AC G7G AAG AA GAGACGCCAC GGGGACGAGG ACATGTTCTA CATGCACG7G 
1051 CG AGGC Z GGG ACAAC777GA GA7C7TGA7G AAAG7CAAGG AGAGCCTAGA 
110 1 AC7GA7GGAG C77G7GC"C AGCC7T7GGT TGACTCCTAT CG AC AGC AGC 
1131 AGC.AGCAGCA GC7777ACAG AGGCCGAGTC ACC7GCAGCC 7CCA7CC7AT 
1201 GGGCCCGTGC 7C77C77AAT G AAC AAGG7 A CACGG7GGTG 7CAACAAACT 
1251 GCC^TCCGTC AACZACC7GG 7GGGCCAGCC TCCCCCGCAC AGCTCAGCAG 
13 01 C7GGGCCCAA CC7GGCGCCC ATGGGCTCCG GGATGCTCAA CAGCCACGCC 
13 51 c AC AGC A7 GC CGGC7AA7GG TGAGATGAAT GGAGGCCACA GCTCCCAGAC 
1401 CATGGTTTCG GG A7CC C ACT GcACCCCGCC ACCCCCCTAT CATGcAGACC 
1451 CCAGCCTCGT CAG7T7TTTG ACAGGGTTGG GGTGTCCAAA CTGCATCGAG 
1501 TGCTTCACTT CCCAAGCGTT GCAGAGCATC TACCACCTGC AG AAC CTT AC 
15 51 CATCGAGGAC CTTGGGGCTC TGAAGGTCCC TGACCAGTAC CGTATGACCA 
1601 TCTGCAGGCG CCTACAGGAC CTCAAGCAGA GCCATGACTG CGGCCAGCAA 
165 T"' CTOCTACGCT CGAGCAGCAA CGCGCCCACC ATCTCCATCG GCGCCTCTGG 

- "1701 CCAGCTCCAG CGGCAGCGGG TCATGGAAGC CGTGCATTTC CGTGTGCGCC 
' 17 51 ACACCATCAC AATCCCCAAC CGTGGACCCG CAGCTGCCCT GACAGCTCCC 

1301 GACGAGTGGG CGGACTTTGG CTtTGACCTG CCTGACTGCA ACTCCCGTAA 

- 13S1 GCAGCCCATC AAAGAGGAGT TCACACAGAC ACACACCCAC TGAGGAACGT 
1901 ACCTTCTTCT CCTGTCCTTC CTCTCTGAGA AACTGCTCTT GGAAGTGCGA 
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19 51 C" "TGGC7 gtgcccacag AAACCAGCAA ggaccttctg ccggat 
200 1 T7CCTGAAGG GAAG7CGCTC ATGAACTAAC TCCCTCT7GG 
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(2) INFORMATION POUR LA SEQ ID No 8 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 589 acides amines 

(B) TYPE : acide amine 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : proteine 
(xi) DESCRIPTION DE LA SEQ ID No 8 : 

1 MCy.GPVYISl GQAQFN" L5S AXEQMGSP.AA ?A5?YT?EKA A3A?7KS?YA 

SI C?33T73Cy.3 ?A?VI?SN?D YPGPHKrsV? FCQSSTAXSA TWTVSPLLXX 

101 LYCQZAKTC? IQr:-7-/ST??? PGTAIPAMPV TsKJ^rTrTDZ YI<RC?N*HELG 

151 RDFNZGQSA? A3KL IRYEGM NLAQYVDDPV TGRQSVWPY ZPPQVGTEFT 

201 tiiyntmcns scvGc:crR?.? i://::tletr cg-;vigrrsf egr:cac?gr 

251 DRXADECKYR ECQAL2IES7T 3CJGAASK3AF XwSPPAIPAL GTNVXXiUlHG 

301 CEDMFYXKV?. CRZNTE:L>C< VKESLELMEL VPQPLVDSYR CCQQCQ^LQR 

351 PSKLQPPSYG PVL5PSOTCVK GGVN7-C-PSYM QLVCQPPPKS SAAGPN1.GPM 

401 GSGMLNSKGK SMPAMGEMNC GKS3QTHVSG SKC7PPPPYH A2PSLVSFLT 

451 glgc?n*c:zc ftscglcsiy hlqnit:*£3L galxvpcc** >t:iwrg:.gdl 

501 KQSKDCGQC- ~RSSS::AA7: S1GG3GE1QR Q R7>£EA VHF R VRHTITIPMR 
551 GGAGAY7G?D EWADFGFDL? 2CXSRXQPIX ZZFTE7ESH 
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(2) INFORMATION POUR LA SEQ ID No 9 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 7 58 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADNc 

(vi) ORIGINE : 

(A) ORGANISME : souris 

(ix) CARACT ERI STI QUE ADDITIONNELLE : 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT : 3 88. -75 6 

(xi) DESCRIPTION DE LA SEQUENCE No 9 : 



1 TGGTCCCGCT TCGACCAAGA CTCCGGCTAC CAGCTTGCGG GCCCCGCGGA 
51 GGAGGAGACC CCGCTGGGGC TAGCTGGGCG ACGCGCGCCA AGCGGCGGCG 
101 GGAAGGAGGC GGGAGGAGCG GGGCCCGAGA CCCCGACTCG GGCAGAGCCA 
151 GCTGGGGAGG CGCGGCGCGC GTGGGAGCCA GGGGCCCGGG TGGCCGGCCC 
201 TCCTCCGCCA CGGCTGAGTG CCCGCGCTGC CTTCCCGCCG GTCCGCCAAG 
251 AAAGGCGCTA AGCCTGCGGC AGTCCCCTCG CCGCCGCCTC CCTGCTCCGC 
301 ACCCTCATAA CCCGCCGTCC CGC ATCCAGG CGAGGAGGCA ACGCTGCAGC 
351 CCAGCCCTCG CCGACGCCGA CGCCCGGCCC GGAGCAGAAT GAGCGGCAGC 
401 GTTGGGGAGA TGGCCCAGAC CTCTTCTTCC TCCTCCTCCA CCTTCGAGCA 
451 CCTGTGGAGT TCTCTAGAGC C AG AC AGC AC CTACTTTGAC CTCCCCCAGC 
50 1 CvAGCCAAGG G ACT AGC 3 AG GCATCAGGCA GCGAGGAGTC CAACATGGAT 
551 GTCTTCCACC TGCAAGGCAT GGCCCAGTTC AATTTGCTCA GCAGTGCCAT 
501 GGrtCCAGATG GGCAGCCGTG CGGCCCGGGC GAGCCCCTAC ACCCCGGAGC 
651 ACGCCGCCAG CGCGCCCACC CACTCGCCCT ACGCGCAGCC CAGCTCCACC 
70 1 TTCGACACCA TGTCTCCGGC CCCTGTCATC CCTTCCAATA CCGACTACCC 
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(2) INFORMATION POUR LA SEQ ID No 10 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 123 acides amines 

(B) TYPE : acide amine 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : proteine 
(xi) DESCRIPTION DE LA SEQ ID No 10 : 



I MSGS", 



37G=*Q TSSS333T-S KLWSSLSPOS TYrDLPQPSQ GTSSASG»« 



u-rvtr^ms AS^'T^SKAA SA?TK3?YAQ 
51 SNMSVTHI-CG MAQFN^ISSA >ECM.GS?J\A- A5> 

101 ?SSTr3TMS? APVIPSNT3-' ?G? 
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(2) INFORMATION POUR LA SEQ ID No 11 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 17 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : oligonucleotide 
( iii ) ANTI-SENS : non 

(xi) DESCRIPTION DE LA SEQ ID No 1 1 : 
GCG AGC TGC CCT CGG AO? 

T * f 
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(2) INFORMATION POUR LA SEQ ID No 12 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 19 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : oligonucleotide 

(iii) ANTI-SENS : oui 

(xi) DESCRIPTION DE LA SEQ ID No 12 : 
GGT TCT GCA GGT GAC TCA G 
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(2) INFORMATION POUR LA SEQ ID No 13 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 18 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : oligonucleotide 

(iii) ANTI-SENS : non 

(xi) DESCRIPTION DE LA SEQ ID No 13 : 
GCC ATG CCT GTC TAC AAG 
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(2) INFORMATION POUR LA SEQ ID No 14 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 18 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : oligonucleotide 

(iii) ANTI-SENS : oui 

(xi) DESCRIPTION DE LA SEQ ID No 14 : 



ACC AGC TGG TTG ACG GAG 
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(2) INFORMATION POUR LA SEQ ID No 15 : 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR : 21 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

( ii ) TYPE DE MOLECULE : oligonucleotide 

(iii) ANTI- SENS: non 

(xi) DESCRIPTION DE LA SEQ ID No 15 : 
GTC AAC CAG CTG GTG GGC CAG 
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(2) INFORMATION POUR LA SEQ ID No 16 : 

(i) C ARACTER I ST I QUE S DE LA SEQUENCE : 

(A) LONGUEUR : 16 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : oligonucleotide 

(iii) ANTI-SENS : oui 

(xi) DESCRIPTION DE LA SEQ ID No 16 : 
GTG GAT CTC GGC CTC C 



REVENDICATIONS 



Polypeptide purifie, comprenant une sequence d'acides amines choisie 
parmi : 

a) la sequence SEQ ID n° 2 ; 

b) la sequence SEQ ID n° 4 ; 

c) la sequence SEQ ID n° 6 ; 

d) la sequence SEQ ID n* 8 ; 

e) la sequence SEQ ID n* 10 ; 

f) toute sequence biologiquement active derivee de SEQ ID n° 2, SEQ ID 
n° 4. SEQ ID n* 6, SEQ ID n* 8 ou SEQ ID n* 10. 

Polypeptide selon la revendication 1, caracterise en ce qu'il comprend la 
sequence d'acides amines SEQ ID n° 6. 

Polypeptide selon la revendication 1 , caracterise en ce qu'il comprend la 
sequence comprise entre : 

- le residu 1 10 et le residu 31 0 de SEQ ID n* 2, 4 ou 6 ; 

- le residu 60 et le residu 260 de SEQ ID n* 8 ; 

- le residu 109 et le residu 123 de SEQ ID n* 10. 

Polypeptide selon la revendication 1 , caracterise en ce qu'il resulte d'un 
epissage alternatif de I'ARN messager du gene correspondant. 

.Polypeptide selon I'une quelconque des revendications precedentes, 
caracterise en ce qu'il s'agit d'un polypeptide recombinant produit sous la 
forme d'une proteine de fusion. 

Sequence d'acides nucleiques isolee codant pour un polypeptide selon 
I'une quelconque des revendications precedentes. 

Sequence d'acides nucleiques isolee selon la revendication 6, caracterisee 
en ce qu'elle est choisie parmi : 

a) la sequence SEQ ID n° 1 ; 

b) la sequence SEQ ID n° 3 ; 

c) la sequence SEQ ID n° 5 ; 



d) la sequence SEQ ID n*7 ; 

e) la sequence SEQ ID n"9 ; 

f) les sequences d'acides nucleiques capables de s'hybrider a la sequence 
SEQ ID n° 1, SEQ ID n° 3, SEQ ID n° 5, SEQ ID n*7 ou SEQ ID n*9 ou a 
leurs sequences complementaires, ou de s'hybrider a leurs sequences . 
proxi males.; 

g) les sequences derivees des sequences a), b), c), d), e) ou f) du fait de la 
degenerescence du code genetique. 

8. Sequence nucleotidique selon la revendication 6, caracterisee en ce qu'il 
s'agit de la sequence SEQ ID n° 5 codant pour le polypeptide de sequen- 
ces SEQ ID n° 6. 

9. Vecteur de clonage et/ou d'expression contenant une sequence d'acides 
nucleiques selon Tune quelconque des revendications 6 a 8. 

10. Vecteur selon la revendication 9, caracterise en ce qu'il s'agit du plasmide 
pSE-1. 

1 1 . Cellule hdte transfectee par un vecteur selon la revendication 9 ou 10. 

12. Cellule note transfectee selon la revendication 11, caracterisee en ce qu'il 
s'agit de E. coliUC 1061 . 

13. Sonde nucleotidique ou amorce nucleique caracterisee en ce qu'elle 
Vhybride specifiquement avec I'une quelconque des sequences selon les 
revendications 6 a 8 ou leurs sequences complementaires ou les ARN 
messagers correspondants ou les genes correspondants. 

14. Sonde selon la revendication 13, caracterisee en ce qu'elle comporte au 
rnoins 10 nucleotides. 

15. Sonde selon la revendication 13, caracterisee en ce qu'elle comprend 
~ " I'integralite de la sequence du gene codant pour Tun des polyeptides de la 

revendication 1 . 



16. Sondes nucleotides caracterisees en ce qu'elles comprennent les 
oligonucleotides suivants ou leurs complementaires : 

SEQ ID n # 1 1 : GCG AGC TGC CCT CGG AG 
SEQ ID n* 12 : GGT TCT GCA GGT GAC TCA G 
SEQ ID n* 1 3 : GCC ATG CCT GTC TAC AAG 
SEQ ID n- 1 4 : ACC AGC TGG TTG ACG GAG 
SEQ ID n* 1 5 : GTC AAC CAG CTG GTG GGC CAG 
SEQ ID n* 1 6 : GTG GAT CTC GGC CTC C 

17. Couples d'amorces nucleotidiques caracterisees en ce qu'elles s'hybrident 
avec I'un des sequences 6 a 8 ou leur complementaire et permettent 
('amplification d'une des sequences 6 a 8 par la technique de PCR ou toute 
autre variante de ceile-ci. 

18. Couple d'amorces nucleotidiques, caracterise en ce qu'il comprend les 
amorces de sequences suivantes : 

a) SEQ ID n° 1 1 

amorce sens : GCG AGC TGC CCT CGG AG 

SEQ ID n° 12 
amorce antisens : GGT TCT GCA GGT GAC TCA G 

*""-b) .SEQ ID n*1 3 
.amorce sens : GCC ATG CCT GTC TAC AAG 

SEQ ID n* 14 

amorce antisens : ACC AGC TGG TTG ACG GAG - 
c) SEQ ID n° 15 

amorce sens : GTC AAC CAG CTG GTG GGC CAG 

SEQ ID n° 16 
amorce antisens : GTG GAT CTC GGC CTC C 



19. Utilisation d'une sequence selon I'une quelconque des revendications 6 a 8, 
pour la realisation de sondes nucleotidiques de diagnostic ou de sequences 
antisens utilisables en therapie genique. 

20. Utilisation d'une sonde selon Tune quelconque des revendications 13 a 16, 
comme outil de diagnostic in vitro pour la detection, par des experiences 
d'hybridation, des sequences d'acides nucleiques codant pour un 
polypeptide selon I'une quelconque des revendications 1 a 4, dans des 
echantillons biologiques, ou pour la mise en evidence de syntheses 
aberrantes ou d'anomalies genetiques. 

21 . Methode de diagnostic in vitro pour la detection de syntheses aberrantes ou 
d'anomalies genetiques au niveau des sequences d'acides nucleiques 
codant pour un polypeptide selon I'une quelconque des revendications 1 a 
4, caracterisee en ce qu'elie comprend : 

- la mise en contact d'une sonde nucleotidique selon I'une quelconque des 
revendications 13 a 16 avec un echantillon biologique dans des conditions 
permettant la formation d'un complexe d'hybridation entre ladite sonde et la 
susdite sequence nucleotidique, eventuellement apres une etape prealable 
d'amplification de la susdite sequence nucleotidique ; 

- la detection du complexe d'hybridation eventuellement forme ; 

- eventuellement le sequengage de la sequence nucleotidique formant le 
complexe d'hybridation avec la sonde de ["invention. 

22. Utilisation d'une sequence d'acides nucleiques selon I'une quelconque des 
"revendications 6 a 8, pour la production d'un polypeptide recombinant selon 
I'une quelconque des revendications 1 a 5. 

23. Methode de production d'une proteine recombinante SR-p70, caracterisee 
en ce que Ton cultive des cellules transferees selon la revendication 10 ou 
1 1 dans des conditions permettant ('expression d'un polypeptide recombi- 
nant de sequence SEQ ID n° 2, SEQ ID n° 4, SEQ ID n*6, SEQ ID n* 8 ou 
SEQ ID n # 10 ou tout fragment ou derive biologiquement actif, et que Ton 
recupere ledit polypeptide recombinant. 



16. Sondes nucleotides caracterisees en ce qu'elles comprennent tes 

oligonucleotides suivants ou leurs complementaires : 
SEQ ID n° 1 1 : GCG AGC TGC CCT CGG AG 
SEQ ID n° 12 : GGT TCT GCA GGT GAC TCA G 
SEQ ID n° 13 : GCC ATG CCT GTC TAC AAG 
SEQ ID n° 14 : ACC AGC TGG TTG ACG GAG 
SEQ ID n° 1 5 : GTC AAC CAG CTG GTG GGC CAG 
SEQ ID n° 16 : GTG GAT CTC GGC CTC C 

1 7. Utilisation d'une sequence seton dine quelconque des revendications 6 a 
8 pour la fabrication d'amorce* oOgonucleotidiques pour des reactions de 
sequencage ou d'amplification spdcifique selon la technique de PCR ou 
toute variante de celle-ci. * 1 $ 

18. Couple d'amorces nucleotidiques, caracterise en ce qu'il comprend les 
amorces de sequences suivantes : 

a) SEQ ID n° 11 

amorce sens : GCG AGC TGC CCT CGG AG 

SEQ ID n° 12 
amorce antisens : GGT TCT GCA GGT GAC TCA G 

'b)SEQIDn 0 13 

amorce sens : GCC ATG CCT GTC TAC AAG 

SEQ ID n° 14 
amorce antisens : ACC AGC TGG TTG ACG GAG 

c) SEQ ID n° 15 

amorce sens : GTC AAC CAG CTG GTG GGC CAG 

SEQ ID n° 16 
amorce antisens : GTG GAT CTC GGC CTC C 
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19. Utilisation d'une sequence sefon Tune quelconque des revendications 6 a 
8, pour la realisation de sondes nucleotidiques de diagnostic ou de 
sequences antisens utilisables en therapie genique. 

20. Utilisation d'une sonde selon Tune quelconque des revendications 13 a 
16, comme outil de diagnostic in vitro pour la detection, par des experien- 
ces d 1 hybrid at ion, des sequences d'acides nucleiques codant pour un 
polypeptide selon Tune quelconque des revendications 1 a 4 t dans des 
echantillons biologiques, ou pour la mise en evidence de syntheses 
aberrantes ou d'anomalies gdoMques. 

21 . Methode de diagnostic in vim pour la detection de syntheses aberrantes 
ou d'anomalies genetiques *u niveau des sequences d'acides nucleiques 
codant pour un polypeptide selon Tune quelconque des revendications 1 
a 4, caracterisee en ce qu'elle comprend : 

- la mise en contact d'une sonde nucleotidique selon I'une quelconque 
des revendications 13 a 16 avec un echantillon biologique dans des 
conditions permettant la formation d'un complexe d'hybridation entre 
ladite sonde et la susdite sequence nucleotidique, eventuellement apres 
une etape prealable d'amplification de la susdite sequence nucleotidique ; 

- la detection du complexe d'hybridation eventuellement forme ; 

- eventuellement le sequen9age de la sequence nucleotidique formant le 
complexe d'hybridation avec la sonde de invention . 

22. Utilisation d'une sequence d'acides nucleiques selon I'une quelconque 
des revendications 6 a 8, pour la production d'un polypeptide recombinant 
selon Tune quelconque des revendications 1 a 5. 

23. Methode de production d'un polypeptide selon I'une quelconque des 
revendications 1 a 5 recombinant, caracterisee en ce que Ton cultive des 
cellules transferees selon la revendication 11 ou 12 dans des conditions 
permettant I'expression d'un polypeptide recombinant de sequence SEQ 
ID n° 2, SEQ ID n° 4, SEQ ID n°6, SEQ ID n° 8 ou SEQ ID n° 10 ou tout 

— ' fragment ou derive bioldgiquement actif, et que Ton recupere ledit 
: polypeptide recombinant. 
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16. Sondes nucleotides ayant les sequences suivantes ou leurs 
complementaires : 

SEQ ID n° 1 1 : GCG AGC TGC CCT CGG AG 
SEQ ID n° 12 : GGT TCT GCA GGT GAC TCA G 
SEQ ID n° 13 : GCC ATG CCT GTC TAC AAG 
SEQ ID n° 14 : ACC AGC TGG TTG ACG GAG 
SEQ ID n° 15 : GTC AAC CAG CTG GTG GGC CAG 
SEQ ID n° 16 : GTG GAT CTC GGC CTC C 

17. Utilisation d'une sequence selon Tune quelconque des revendications 6 a 
8 pour la fabrication d'amorces oligonucleotidiques pour des reactions de 
sequencage ou d'amplification specif ique selon la technique de PCR ou 
toute variante de celle-ci. 

18. Couple d'amorces nucleotidiques, caracterise en ce qu'il comprend les 
amorces de sequences suivantes : 

a) SEQ ID n° 1 1 

amorce sens : GCG AGC TGC CCT CGG AG, 

SEQ ID n° 12 
amorce antisens : GGT TCT GCA GGT GAC TCA G 

b) SEQIDn°13 

ajnorce sens : GCC ATG CCT GTC TAC AAG 

SEQ IDn° 14 
amorce antisens : ACC AGC TGG TTG ACG GAG 

c) SEQ IDn° 15 

amorce sens : GTC AAC CAG CTG GTG GGC CAG 

SEQ IDn° 16 
amorce antisens : GTG GAT CTC GGC CTC C 
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24. Anticorps mono ou polyclonaux ou leurs fragments, anticorps chimeriques 
ou immunoconjugues, caracterises en ce qu'ils sont capables de 
reconnaitre specifiquement un polypeptide selon Tune quelconque des 
revendications 1 a 4. 

25. Utilisation des anticorps selon la revendication precedente, pour la 
purification ou la detection d'un polypeptide selon Tune quelconque des 
revendications 1 a 4 dans un echantillon biologique. 

26. Procede de diagnostic in vitro de pathologies correlees a une expression 
ou une accumulation anormale de proteines SR-p70, notamment les 
phenomenes de cancerisation, a partir d'un prelevement biologique, 
caracterise en ce que Ton met en contact au moins un anticorps selon la 
revendication 24 avec ledit prelevement biologique, dans des conditions 
permettant la formation eventuelle de complexes immunologiques specifi- 
ques entre une proteine SR-p70 et le ou lesdits anticorps et en ce que 
Ton detecte les complexes immunologiques specifiques eventuellement 
formes. 

27. Kit pour le diagnostic in vitro d'une expression ou une accumulation 
anormale de proteines SR-p70 dans un prelevement biologique et/ou 
pour la mesure du taux d'expression de celles-ci dans ledit prelevement 
comprenant : 

-_au moins un anticorps selon la revendication 24, eventuellement fixe sur 
un support, 

- des moyens de revelation de la formation de complexes 
antigenes/anticorps specifiques entre une proteine SR-p70 et ledit 
anticorps et/ou des moyens de quantification de ces complexes. 

28. Methode pour le diagnostic precoce de la formation des tumeurs 
caracterisee en ce que Ton met en evidence dans un echantillon de 
serum preleve chez un individu des auto-anticorps diriges contre une 
proteine SR-p70 selon les etapes consistant a mettre en contact, un 
echantillon de serum preleve chez un individu avec un polypeptide de 
I'invention, eventuellement fixe sur un support, dans des conditions 
permettant la formation de complexes immunologiques specifiques entre 
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24. Anticorps mono ou polyclonaux ou leurs fragments, anticorps chimeriques 
ou immunoconjugues, caracterises en ce qu'ils sont capables de 
reconnaitre specifiquement un polypeptide selon I'une quelconque des 
revendications 1 a 4. 

25. Utilisation des anticorps selon la revendication precedente, pour la 
purification ou la detection d'un polypeptide selon Tune quelconque des 
revendications 1 a 4 dans un echantillon biologique. 

26. Procede de diagnostic in vitro de pathologies correlees a une expression ou 
une accumulation anormale de proteines SR-p70, notamment les 
phenomenes de cancelation, a partir d'un prelevement biologique, 
caracterise en ce que Ton met en contact au moins un anticorps selon la 
revendication 24 avec ledit prelevement biologique, dans des conditions 
permettant la formation eventuelle de complexes imrnunologiques specifi- 
ques entre une proteine SR-p70 et le ou lesdits anticorps et en ce que Ton 
detecte les complexes imrnunologiques specifiques eventuellement formes. 

27. Kit pour le diagnostic in vitro d'une expression ou une accumulation 
anormale de proteines SR-p70 dans un prelevement biologique et/ou pour 
la rnesure du taux depression de celles-ci dans ledit prelevement 
comprenant : 

- au moins un anticorps selon la revendication 24, eventuellement fixe sur 
- un support, 

^-des moyens de revelation de la formation de complexes 
antigenes/anticorps specifiques entre une proteine SR-p70 et ledit 
anticorps et/ou des moyens de quantification de ces complexes. 

28. Methode pour le diagnostic precoce de la formation des tumeurs 
caracterisee en ce que Ton met en evidence dans un echantillon de serum 
preleve chez un individu des auto-anticorps diriges contre une proteine 
SR-p70 selon les etapes consistant a mettre en contact un echantillon de 
serum preleve chez un individu avec un polypeptide de I'invention, 
eventuellement fixe sur un support, dans des conditions permettant la 
formation de complexes imrnunologiques specifiques entre ledit polypeptide 
et les auto-anticorps eventuellement presents dans I'echantillon de serum, 
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et en ce que Ton detecte les complexes immunologiques spectfiques 
eventuellement formes. 

29. Composition pharmaceutique comprenant, a titre de principe actif, un 
5 polypeptide selon Tune quelconque des revendications 1 a 4. 

30. Composition pharmaceutique selon la revendication precedente, 
caracterisee en ce qu'elle comprend un polypeptide selon la revendication 
2. 

10 

31. Composition pharmaceutique contenant un inhibiteur ou un activateur de 
I'activite du SR-p70. 

15 
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30 
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ledit polypeptide et les auto-anticorps eventuellement presents dans 
I'echantillon de serurn. et en ce que Ton detecte les complexes 
immunologiques specifiques eventuellement formes. 

29. Composition pharmaceutique comprenant, a titre de principe actif, un 
polypeptide selon Tune quelconque des revendications 1 a 4. 

30. Composition pharmaceutique selon la revendication precedente, 
caracterisee en ce qu'elle comprend un polypeptide selon la revendication 
2. 



31. Composition pharmaceutique contenant un inhibiteur ou un activateur de 
I'activite du SR-p70. 
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1 TGCC7CCCCGCCCGCGCACCCGCCCCGAGGCCTGTGCTCCTGCGAAGGGG 50 

I ! I 1 1 I 

1 GGGGCTCCGGGG 12 

51 ACGCAGCGAAGCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATG 100 

III ! Mill III II I M I 

13 ACACTTGGCGTCCGGGCTGGAAGCGTGCTTTCCAAGACGGTGACACGCTT 62 

101 CCCGGAGCTGCGACGGC7GCAGAGCGAGC7GCCCTCGGAGGCCGGTGTGA 15 0 

Ml 111 ! i i i ! I I ! i I i Mi I i 

6 3 CCCTGAGGATTGGCAGCCAGACTGCTTACGGGTCAC. . . TGCCATGGAGG 10 9 
151 GGAAGATGGCCCAGTCCACCACCACCTCCCCCGATGGGGGCACCACGTTT 200 

I I I I I Ml M I MM I Mill 

110 AGCCGCAGTCAGATCCCAGCATCGAGCCCCCTCTGAGTCAGGAAACATTT 159 
201 GAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACTTCGACCTTCC 250 

MM MM !l I iii I I II MM I 

160 TCAGACCTATGGAAACTACTTCCTGAAAACAAC.GTTCTGTCCCCCTTGC 20 8 

2 51 CCAGTC AAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGC A 3 00 

I Mill I II Ml I ! M MM I 

20 9 CGTCCCAAGCGGTGGATGATTTGATGCTCTCTCCGGATGATCTTGCACAA 258 

301 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC 350 

Ml I II I Mill M 

259 TGG TTAACTGAAGACCCAGGTC 280 

3 51 AATTTGCTGAGCAGCACCATGGACCAGATGAGC AGCCGCGCTGCCTCGGC 400 

| || I I Mill III II III 

281 C AG ATG AAGCTC CCAGAATGTCAGAGGCTGCTCCCCACA 319 

401 CAGCCCGTACACCCCGGAGCACGCCGCCAGCGTGCCCACCCATTCACCCT 450 

I 1 1 I Mill I I i i ill I 1 1 I Ml ^ q 

3 2 0 TGGCCCCCACACC AGCAGCTCCTACACCGGCGGCCCCTGCACCAGCCCC . 3 6 8 

451 ACGCACAGCCCAGCTCCACCTTCGACACCATGTCGCCCGCGCCTGTCATC 500 

II I I II II I I 

369 CTCCTGGCCCCTGTCATCCTCTGTC 393 

501 CCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGGTCACTTTCCA 550 

M III I I Ml ! Ml III IM I MM 

394 CCTTCCCAGAAAACCTACCACGSCAGCTACGGTTTCCGTCTGGGCTTCCT 443 
551 GCAGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTGA 600 

- Mill I 1 1 I I 1 1 M M I MM 1 I I I 1 1 I I I I i I I I 

4 44 GCATTCTGGAACAGCCAAGTCTGTGACTTGCACGTACTCCCCTGACCTCA 4 93 
601 AGAAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTG 650 

I II II MINI I ill Mil I HUM I III I III ^ 

494 ACAAGATGTTTTGCCAGCTGGCCAAGACCTGCCCCGTGCAGCTGTGGGTT 543 
6 51 TCCGCCCCACCGCCCCCGGGCACCGCCATCCGGGCCATGCCTGTCTACAA 7 00 

II MM II II MM I I MM MMII I MMIM co ^ 

5 44 GATTCCACACCCCCGCCCGGCAGCCGCGTCCGCGCCATGGCCATCTACAA 5 93 
701 GAAGGCGGAGCACGTGACCGACATCGTGAAGCGCTGCCCCAACCACGAGC 7 50 

I II I Mill MM M MINI I II I 1 1 I II I II I I INI 

5 94 GCAGTCACAGCACATGACTGAGGTCGTGAGGCGCTGCCCCCACCATGAGC 643 
751 TCGGGAGGGACTTCAACGAAGGACAGTCTGCCCCAGCCAGCCACCTCATC 8 00 

II II I MM" MMI I ■ M Tl "Ml 

6 44 GCTGCTCAGACAGCGATGGA CTGGCCCCTCCTCAACATCTTATC 6 87 

801 CGTGTGGAAGGCAATAATCTCTCGCAGTATGTGGACGACCCTGTCACCGG 8 50 

M I M Mill III I I Mill II MM III 

6 8 8 CGAGTGGAAGGAAATTTGCGTGTGGAGTATTCGG ATGACAGAAACACTTT 7 37 
8 51 CAGGC AG AGCGTCGTGGTGCCCTATG AGCC ACCACAGGTGGGGACAGAAT 900 

I II II II II II II I MM M MM II I 1 1 I II I III 

7 3 8 TCGAC AT AGTGTGGTGGTGCCCTATGAGCCGCCTGAGGTTGGCTCTGACT 7 87 
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901 TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGC 950 

I I I ! I ! I ] I I I i 1 I I I 1 I ! 1 1 I 1 1 ! i I ! ! Mi M I I i I ! 

7 3 3 GTACCACCATCCACTACAACTACATGTGTAACAGTTCCTGCATGGGCGGC 337 
951 ATGAACCGACGGCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGG 10 00 

II II Ml I III II Ml II II M MM II Ml I 111 QQ . 

8 3 8 ATGAACCGGAGGCCC ATCCTCACAATTATCACACTGGAAGACTCCAGTGG 8 37 
1001 GCAGGTGCTGGGCCGCCGGTCCTTCGAGGGCCGCATCTGCGCCTGTCCTG 10 50 

I I II Ml M Ml MM M I M Mill Mill „ 

89 8 TAATCTACTGGGACGGAACAGCTTTGAGGTGCGAGTTTGTGCCTGTCCTG 9 37 
1051 GCCGCGACCGAAAAGCCGATGAGGACCACTACCGGGAGCAGCAGGCCTTG 1100 

I I Mill I II II II M M I i 

93 8 GG AG AG AC C GGCGC AC AG AGGAAG AG AATTTCC G 971 

1101 AATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCGCCTTCAAGCA 1150 

I M M Mil I I M 1 1 1 I I II I iMi 

97 2 C AAGAAAGGGGAGCCTTGCCACGAGCTGCCCCCTGGGAGCACT AAGCGAG 1021 

1151 GAGTCCCCCTGCCGTCCCCGCCCTGGGCCC . GGGTGTGAAGAAGCGGCGG 1199 

I I III II Ml III I llllll I I I , A , f 

102 2 CACTGCCCAACAACACCAGCTCCTCTCCCCAGCCAAAGAAGAAACCACTG 1071 - 

1200 CACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTT 12 49 

I Mill I Ml III Ml I 1 1 II II Ml III 

107 2 GATGGAG AAT ATTTC AC CCTTC AGATCCGCGGGCGTGAGCGCTT 1115 

1250 CGAGATCCTGATGAAGCTGAAGGAGAGCCTGGAGCTGATGGAGTTGGTGC 12 99 

II M M I MM II I III I MM II I III 

1116 CGAGATGTTCCGAGAGCTGAATGAGGCCTTGGAACTCAAGGA 1157 

13 00 CGCAGCCGCTGGTAGACTCCTATCGGCAGCAGCAGCAGCTCCTACAGAGG 13 49 

M II Ml I I ^ M Ml llllll U III 

• 1158 TGCCCAGGCTGGGAAAGAGCCAGCGG . . GGAGCAGGGCTCACTCCAGCCA 1205 

135 0 CCGAGTCACCTACAGCCCCCATCCTACGGGCCGGTCCTCTCGCCCATGAA 13 99 

II II I I llllll Ml 

1206 CCTGAAGTCCAAGAAGGGGCAATCTACCTCCCGCCATAAAAAATTCATGT 12 55 

140 0 CAAGGTGCACGGGGGCGTGAACAAGCTGCCCTCCGTCAACCAGCTGGTGG 14 49 

II Mill II III I II U M I I I iiAft 

1256 TCAAGACAGAGGGGCCTGACTCAGACTGACATTC TCAGCTTCTTG 13 00 

1450 GCCAGCCTCCCCCGCACAGCTCGGCAGCTACACCCAACCTGGGACCTGTG 1499 

I II I M I II M I Ml M I Ml _ q 

1301 TTCCCCCACTGAGCCTCCCACCCCCATCT . CTCCCTCCCCTGCCATTTTG 1349 

1500 GGCTCTGGGATGCTCAACAACCACGGCCACGCAGTGCCAGCCAACAGCGA 1549 

| M M M I IM I M Ml I II Ml I _ _ _ 

135 0 AGTTCTGGGTCTTTAAACCCTTGCTTGCAATAGGTGTGTGTCAGAAGCAA 13 99 

155 0 GATGACCAGCAGCCACGGCACCCAGTCCATGGTCTCGGGGTCCCACTGCA 15 99 
1400 A 1400 
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1 MAQSTTTSPDGGTTFEHLVoSLEPDSTYFDLPQSSRGNNEWGGTDSSMD 50 

..|:::..:|. :| :-|: M - .:|| : . -:| 

1 MEEPQSDPSIE??LS . . . . QETFSDLVC-CLLPENNVLSPLPSQAVD 41 

51 VFHLEGMTTSVMAQFNLL5STMDQMSSRAASASPYTPEHAASVPTHSPYA 100 

: I . • - : I I : . • • I = I - • - I - • I I - ■ I ■ - I : 

42 DLML. . . SPDDLAQWLTECPGPDEAPRMSEAAPHMAPTPAAPTPA. APAP 87 

101 QPSSTFDTMSPAPVIPSNTDYPGPHHFEVTFQQSSTAKSATWTYSPLLKK 150 

.||-.: I -I :hil!U Mil I * I 

88 APSWPL SS SVPSQKTYKGS YGFRLGFLHSGTAKSVTCTYS PDLNK 13 2 

151 LYCQIAKTCPIQIKVSA???PGTAIRAM?VYKKAEHVTDIVKRCPNHELG 200 

::| : I I h ^ I I • - ■ h h - I : I I I • I I _ 

133 MFCQLAXTCPVQLWVDSTPPPGSRVRAMAIYKQSQHMTEVVRRCPHHE . . 180 



201 RDFNEGQSAPASHLIRVEGNNLSQYVDDPVTGRQSVVVPYEPPQVGTEFT 25 0 

I Ih IIIIM!! =1 II- I I : M I I I I I I I • I I - I 

181 RCSDSDGLAPPQHLIRVEGNLRVEYSDDRNTFRHSVWPYEPPEVGSDCT 23 0 

251 T ILYNFMCNSSCVGGMNRRPILI I ITLETRDGQVLGRRSFEGRICAC PGR 300 

II l|:|Mllhllli:';ii.|||||.-.|.:|II.IM-hlMIM 

231 T IHYNYMCNSSCMGGMNK?.? I LT I ITLEDSSGNLLGRNSFEVRVCAC PGR 280 
301 DRKADEDHYREQQALNES SPUING AASKRAFKQSPPAVPALGPGVKKRRHG 35 0 
281 DRRTEEENFRKKG . . EPCHELPPGSTKRALPNNTSSSPQ PKKKPL 323 

J51 DEDTYYLQWGRENFEIUMKLKESLEL>IELVPQPLVDSYRQQQQLLQRPS 40 0 

h: : I I : I I I I - I 1 : - ■ I • I • I I I - = = l-= „, 

324 DGEYFTLQIRGRERFEMFRZLNEALELKDAQAGKEPAGSRAHSSHLKSKK 37 3 

4 01 HLQPPSYGPVXSP>tNKv'>:GG , -yNT<:LPSV f NQLVGQPPPHSSAATPNLGPVGS 45 0 
3 74 GQSTSRHKKFMFKTEGPZSD 393 
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1 TGCCTCCCCGCCCGCGCACCCGCCCCGAGGCCTGTGCTCCTGCGAAGGGG 50 

IMMIIMMIMIIMMMIMIMMMMIMMIMMMIMI 

1 TGCCTCCCCGCCCGCGCACCC3CCCCGAGGCCTGTGCTCCTGCGAAGGGG 50 
51 ACGCAGCGAAGCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATG 100 

m mi mill i iii mi it Mini ii inn i iii ii ii ii 

51 ACGCAGCGAAGCCGGGGCCCGC3CCAGGCCGGCCGGGACGGACGCCGATG 100 

101 CCCGGAGCTGCGACGGCTGCAGAGCGAGCTGCCCTCGGAGGCCGGTGTGA 150 

CC|II Ml I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | I 
101 CCCGGAGCTGCGACGGCTGCAGAGCGAGCTGCCCTCGGAGGCCGGTGTGA 150 

,ci GGAAGATGGCCCAGTCCACCACCACCTCCCCCGATGGGGGCACCACGTTT 200 
151 GGAAGATGGCCC | | | M M M I I I I M M I I MM I I I Ml ^ 

151 GGAAGATGGCCCAGTCCACCACCACCTCCCCCGATGGGGGCACCACGTTT 200 

2 0 1 GAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACTTCGACCTTCC 2 5 0 

I M 1 1 M ill 1 1 M M M M M I I Mil II I M I 1 1 II II II 1 1 1 1 _ 

2 01 GAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACTTCGACCTTCC 2 50 

251 CCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 300 

M Ml Mill II Ml I II Mill I III I II II MMI , nn 

2 51 CCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 300 

3 01 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC 3 50 

| | 1 1 [ I I I I 1 1 I I 1 I I I ! I t i t 1 ! t 1 I 1 1 I 1 1 I f I I f I I 1 I 1 I I I i JL ' ■ JL « n 

3 01 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC 3 50 
3 51 AATTTGCTGAGCAGCACCAT3GACCAGATGAGCAGCCGCGCTGCCTCGGC 4 00 

M I ! I II II M I M II I I M I M I I I I II I I II M II I M I M 1 1 1 1 II I nn 

3 51 AATTTGCTGAGCAGCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGGC 4 00 
401 CAGCCCGTACACCCCGGAGCACGCCGCCAGCGTGCCCACCCATTCACCCT 4 50 

| | | | | | | | | M M I II I M M I II II II II I II II M II I I II II 

401 CAGCCCGTACACCCCGGAGCACGCCGCCAGCGTGCCCACCCATTCACCCT 4 50 
451 ACGCACAGCCCAGCTCCACCTTCGACACCATGTCGCCCGCGCCTGTCATC 5 00 

t^Tm I M II II M II i ! M I II M I M M M I 1 1 II II II I I M 1 1 cnn 

451 icGCACAGCCCAGCTCcAcCTTCGACACCATGTCGCCCGCGCCTGTCATC 500 
501 CCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGGTCACTTTCCA 5 50 

I M I II M ! ; M I M II i ; . ! i M I ! ! M MM II II I M M I III M II 

50J^ CCCTCCAACACCGACTATCCC3GACCCCACCACTTCGAGGTCACTTTCCA =50 
551 GCXGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTGA 600 

IIMjllMMMIMMUMIMMMIIMMMMIMMMMM ^ 

5 5 1 ^GCAGTCCAic!:ACGGCCA.^3TCAGCCACCTGGACGTACTCCCCACTCTTGA 6 00 
601 AGAAACTCTA3TGCCA3ATC3CC.AAGACATGCCCCATCCAGATCAAGGTG 650 

II I II I I ! i i M M I I I I ! : i I M 1 1 M II 1 MM I Ml Ml MM II 

601 AGAAACTCTACTGCCAGATCGCCAAGACATGCLCl-A-iCi-M^Miv-A^GoTG 65C 
^.- rGCCCCAC - GCCCC CGGGCACC3CCATCCGGGCCATGCCTGTCTACAA 700 

iM!i|!IMT?lTi|M' ! MMiMMMMMMMIMMMMII „ nn 

651 TCCGCCCCACCGCCCCCGGGCACCGCCATCCGGGCCATGCCTGTCTACAA 700 
7G1 GAAGGC33AGCACGTGACC3ACATCGTGAAGCGCTGCCCCAACCACGAGC 750 

i I 1 1 || I I i j | j M M I M : ! ! M M I M I I M I M II II II II 

7Q1 GAAGGCGGAGCACg!3ACC3ACATCGTGAAGCGCTGCCCCAACCACGAGC 750 

751 TCGGGAGGGACTTCAACGAA3GACAGTCTGCCCCAGCCAGCCACCTCATC 800 
I I : I ! i ! ; : : : I i ! i i ; : ; ; I : M i ! M i M I M M I II I M M ! i I ; M 
_-■ 4-CGGGAGGGA-TTCAAC3AAGGACAGTCTGCCCCAGCCAGCCACCTCA-C 800 



CAA^AATCTCTCGCAGTATGTGGACGACCCTGTCACCGG 350 _ 

! i I I I I ; 1 ; : I I I i i I ; ! ! M M i I M I II M M M I 1 1 I i M I M M I i ocn V- f-j •< 
soi ogIgtggUggcUt.Utctctcgcagtatgtggacgaccctgtcaccgg 850 rlU. J 

^ -■ " iGGC AG iGCC'CGTGGTGCCCTATGAGCCACC AC AGGTGGGGACAGAAT 900 

iT m'TTm i m m \\w\w immmmiiimimim;!! nn 

85i CAGGCAGAGCGTC3TGGTGCCCTATGAGCCACCACAGGTGGGGACAGAAT 900 
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901 TCACCACCA7CCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGC 950 

Ml M I M MM M IMMMII M MMM II MM! Ill II II MIM 

901 TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGC 9 50 

9 51 ATGAACCGACGGCCCATCCTCATCATCATCACCCTGGAGACGCGGGA7GG 1000 

M M M M M M I M M M M i M I i ! I! M ! M M I I I I M M I M M ! 

9 51 ATGAACCG ACGGCCCATCCTCATCATCATCACCCTGGAGACGCGGGAT3G 1000 

1001 GCAGGTGCTGGGCCGCCGGTCCTTCGAGGGCCGCATCTGCGCCTGTCCTG 10 50 

! M M I I i M M I I i M M M M I M M M I i M I M I M M I ! M ! ! M 

1001 GC AGGTGCTGGGCCGCCGGTCCTTCGAGGGCCGCATCTGCGCCTGTCCTG 10 50 

1051 GCCGCG ACCGAAAAGCCG ATGAGGACCACTACCGGGAGCAGCAGGCCTTG 1100 

I I I I M M M M I I 1 1 i M M I I I M M I M I I II I I I I I II I H ! M M 

1051 GCCGCGACCGAAAAGCCGATGAGGACCACTACCGGGAGCAGCAGGCCTTG 1100 

1101 AATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCGCCTTCAAGCA 1150 

I !l M! Mill Mill II II IMIIIMI M IIMM! MMMI MMf 

1101 AATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCGCCTTCAAGCA 1150 

1151 GAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 12 00 

I M Mi Ml M MM! IMMMMIMI II II MMIMM! M MM! 

1151 GAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 1200 

12 01 ACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTTC 12 50 

I M M MM MM MM! IMMMMIMI I MIM MM IN MMM 

12 01 ACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTTC 12 5 0 

12 51 GAGATCCTGATGAAGCTG AAGG AGAGCCTGG AGCTGATGG AGTTGGTGCC 13 00 

I M I M M M M I I M I II I M M M I I M II M M I M I M II M I M I 

12 51 GAGATCCTGATGAAGCTG AAGG AG AGCCTGG AGCTGATGGAGTTGGTGCC 1300 

13 01 GCAGCCGCTGGTAGACTCCTATCGGCAGCAGCAGCAGCTCCTACAGAGGC 13 50 

M M II II M M I II II I 1 1 I I M II II M M I II I M I M II I M II M 

13 01 GCAGCCGCTGGTAGACTCCTATCGGCAGCAGCAGCAGCTCCTACAGAGGC 13 50 

13 51 CGAGTCACCTACAGCCCCCATCCTACGGGCCGGTCCTCTCGCCCATGAAC 14 00 

M M I I I I II I I I M M ! j ! I I M I I li I 1 1 1 1 I I M I I I I 1 1 II I M M 

13 51 CGAGTCACCTAC AGCCCCCATCCTACGGGCCGGTCCTCTCGCCCATGAAC 14 00 

14 01 AAGGTGCACGGGGGCGTGAACAAGCTGCCCTCCGTCAACCAGCTGGTGGG 14 5 0 

I 1 1 I I I 1 1 I I I II M M M I M I I I I I I I I II M I II I I I I I M I 1 1 I M 

14 01 AAGGTGC ACGGGGGCGTG AAC AAGCTGCCCTCCGTC AACCAGCTGGTGGG 14 50 

14 51- CCAGCCTCCCCCGC AC AGCTCGGCAGeTACACCC AACCTGGGACCTGTGG 1500 

II Ml II 1 1 I I I II I II I M II M i I I M I I I I I I I II I I I I I II II I I M 

14 51 CCAGCCTCCCCCGCACAGCTCGGCAGCTACACCC AACCTGGGACCTGTGG 1500 

15 01 GCTCTGGGATGCTC AACAACC ACGGCCACGC AGTGCC AGCCAACAGCGAG 15 50 

I I 1 M II I I i M I ! M i i i M M I I i II li I i II I II I I I I I I I I I M M 

1501 GCTCTGGGATGCTCAACAACCACGGCCACGC AGTGCCAGCCAACAGCGAG 15 5 0 

15 51 ATGACCAGCAGCC ACGGC ACCCAGTCCATGGTCTCGGGGTCCCACTGCAC 16JD0 

II I M M M M M I I M M ! II i I II ! M I II II II I I II M M II II i ! 

15 51 ATGACC AGCAGCC ACGGC AC CCAGTCCATGGTCTCGGGGTCCCACTGC AC 160 0 
1501 TCCGCC ACCCCCCT ACCACGCCGACCCCAGCCTCGTCAGTTTTTTAAC AG 1650 

M ! M M M M ! I M M M M i I II I II I i M M II I 

16 01 TCCGCC ACCCCCCTACCACGCCGACCCCAGCCTCGTC 1537 



_ 1_"01 AGCATTTACCACCTGCAGAACCTGACCATCGAGGACCTGGGGGCCCTGAA 1750 

_ " MMMIMMMMMM 

_ ^ 163 8 AGG ACCTGGGGGCC CTG AA 1655 

I ■ 17 51 GATCCCCGAGCAGTATCGCATGACCATCTGGCGGGGCCTGCAGGACCTGA 180 0 

I II II I I M M II I I M I ! M I M M M ! M M M II M M 1 1 I M M II 
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1657 GATCCCCGAGCAGTATCGCATGACCATCTGGCGGGGCCTGCAGGACCTGA 17 0 6 
1801 AGCAGGGCCACGACTACGGCGCCGCCGCGCAGCAGCTGCTCCGCTCCAGC 1850 

1 1 I I II i I I II I 1 1 1 1 1 1 I I I II I I I 1 1 1 1 1 1 1 1 II I M I I I I I M I I 1 1 

1707 AGCAGGGCCACGACTACGGCGCCGCCGCGCAGCAGCTGCTCCGCTCCAGC 17 5 6 
1851 AACGCGGCCGCCATTTCCATCGGCGGCTCCGGGGAGCTGCAGCGCCAGCG 1900 

Mi II II! MM II II M M MM I III M li il II M II M I II II I II 

17 57 AACGCGGCCGCCATTTCCATCGGCGGCTCCGGGGAGCTGCAGCGCCAGCG 1806 
1901 GGTCATGGAGGCCGTGCACTTCCGCGTGCGCCACACCATCACCATCCCCA 195 0 

MMMMMMMIMI IIMMIMI II II IMMMI Mill II III 

1807 GGTCATGGAGGCCGTGCACTTCCGCGTGCGCCACACCATCACCATCCCCA 1856 
1951 ACCGCGGCGGCCCCGGCGCCGGCCCCGACGAGTGGGCGGACTTCGGCTTC 2 000 

1 1 M I 1 1 1 I I I II I 1 1 1 1 I I I 1 1 M I I II I M 1 1 I I 1 1 1 1 M M II I I II _ 

1857 ACCGCGGCGGCCCCGGCGCCGGCCCCGACGAGTGGGCGGACTTCGGCTTC 1906 
2 001 GACCTGCCCGACTGCAAGGCCCGCAAGCAGCCCATCAAGGAGGAGTTCAC 2 050 

MIMIMMM II MM MIMMMMIII IMMIMMMl illll q 

1907 GACCTGCCCGACTGCAAGGCCCGCAAGCAGCCCATCAAGGAGGAGTTCAC l95o 
2051 GGAGGCCGAGATCCACTGAGGGGCCGGGCCCAGCCAGAGCCTGTGCCACC 2100 

IMM MMI IM M MM I IMIIIIII MM II MIIMIMM Mill 

1957 GGAGGCCGAGATCCACTGAGGGGCCGGGCCCAGCCAGAGCCTGTGCCACC 2 00o 
2101 GCCCAGAGACCCAGGCCGCCTCGCTCTC 212 8 

11 M 1 I M I M i ! I ! I I II I I II II M I 

2 007 GCCCAGAGACCCAGGCCGCCTCGCTCTC 2 03 4 
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1 TGCCTCCCCGCCCGCGCACCCGCCCCGAGGCCTGTGCTCCTGCGAAGGGGACGCAGCGAA 6 0 

6 1 GCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCG ATGCCCGGAGCTGCGACGGCTGC 120 

121 AGAGCGAGCTGCCCTCGG AGGCCGGTGTG AGGAAG ATGGCCCAGTCC ACCACCACCTCCC 180 

-10 MAQSTTTSP 9 

181 CCGATGGGGGCACCACGTTTGAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACT 2 40 

10 DGGTTFEHLWSSLEPDSTYF 29 

2 41 TCGACCTTCCCCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 3 00 
30 DL PQSS RGNNEVVGGTDSSM 49 

3 01 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTCAATTTGCTGA 3 60 
50 DVFHLEGMTTSVMAQFNLLS 69 

3 61 GCAGCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGGCCAGCCCGTACACCCCGGAGC 4 20 
70 STMDQMSSRAASASPYTPEH 89 

421 ACGCCGCCAGCGTGCCCACCCATTCACCCTACGCACAGCCCAGCTCCACCTTCGACACCA 4 80 

90 AASVPTKSPYAQPSSTFDTM 109 

4 81 TGTCGCCCGCGCCTGTCATCCCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGG 5 40 
110 SPAPVI PSNTDYPGPHHFEV 129 

5 41 TCACTTTCCAGCAGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTGA 6 00 
130 TFQQSSTAKSATWTYSPLLK 149 
601 AGAAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTGTCCGCCCCAC 6 60 
150 KLYCQIAKTCPIQIKVSAPP 169 

6 61 CGCCCCCGGGC ACCGCCATCCGGGCCATGCCTGTCTAC AAGAAGGCGG AGC ACGTGACCG 7 20 
170 PPGTAI RAMPVYKKAEHVTD 189 

7 21 ACATCGTGAAGCGCTGCCCCAACCACGAGCTCGGGAGGGACTTCAACGAAGGACAGTCTG 7 80 
190 IVKRCPNHELGRDFNEGQSA 209 

7 81 CCCCAGCCAGCCACCTCATCCGTGTGGAAGGCAATAATCTCTCGCAGTATGTGGACGACC 8 40 
210 PASHLI RVEGNNLSQYVDDP 229 

8 41 CTGTCACCGGCAGGCAGAGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGACAGAAT 9 00 
230 VTGRQSVVVPYEPPQVGTEF 2 49 

9 01 TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGCATGAACCGAC 9 60 

2 50 TT I LYM FMCNS SCVGGMNRR 2 69 

9 61 GGCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGGGCAGGTGCTGGGCCGCCGGT 102 0 

270 PILIIITLETRDGQVLGRRS 289 

1021 CCTTCGAGGGCCGC ATCTGCGCCTGTCCTGGCCGCGACCGAAAAGCCGATGAGGACCACT 108 0 

290 FEGRICACPGRDRKADEDHY 3 09 

10 81 .ACCGGGAGCAGCAGGCCTTGAATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCG 1 14 0 

310 ^_R EQQAL NES^SAKNGAAS K RA 329 

1141 CCTTGAAGCAGAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 120 0 

330 " FKQS ??AVPALGPGVKKRRH 349 

12 01 PKTGGAaACGAGGACACGTACTACCTGC AGGTGCGAGGCCGCGAGAACTTCGAGATCCTGA 126 0 

3 50 G DE DT.V YLQVRG RENFE I LM 3 69 

12 61 TG AAGCTGAAGG AG AGCCTGG AGCTGATGGAGTTGGTGCCGCAGCCGCTGGTAGACTCCT 132 0 
370 K L K E S L KLMELVPQPLVDS Y 3 89 

13 21 ATCGGCAGCAGCAGCAGCTCCTACAGAGGCCGAGTCACCTACAGCCCCCATCCTACGGGC 138 0 
390 RQQQQ ILQRPSHLQPPSVGP 4 09 

13 31 CGGTCCTCTCGCCCATG.^ACAAGGTGCACGGGGGCGTGAACPtAGCTGCCCTCCGTCAACC 144 0 

410 V L S ? X N K V H G G V N K L ? S V N Q 4 29 

1441 AGCTGGTGGGCCAGC3TCCCCCGCACA3CTCGGCAGCTACACCCAACCTGGGACCTGTGG 1 50 0 

430 LVGO???H5SAATPNLG?VG 449 

15 01 GCTCTGGGATGCTC AACAACCACGGCC ACGC AGTGCCAGCCAACAGCGAGATGACCAGCA 156 0 

4 50 SGML N N HGHAVPANSEMTS S 469 
1561 GCCACGGCACCZAGTCCATGGTCTCGGGGTCCCACTGCACTCCGCCACCCCCCTACCACG 162 0 

470 HGTOSMVSGSHCTPPPPYHA 4 39 

16 21 CCGACCCCAGCCTCGTCAGTTTTTTAACAGGATTGGGGTGTCCAAACTGCATCGAGTATT 168 0 
490 DPSLVSFLTGLGCPNCIEYF 509 
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1681 

510 
1741 

530 
1801 

550 
1861 

570 
1921 

590 
1981 

610 
2041 

630 
2101 
2161 
2221 
2281 
2341 
2401 
2461 
2521 
2581 
2641 
2701 
2761 
2821 



TCACGTCCCAGGGGTTACAGAGCATTTACCACCTGCAGAACCTGACCATCGAGGACCTGG 
TSQGLQS IY HLQNLTIEDLG 
GGGCCCTGAAGATCCCCGAGCAGTATCOCATGACCATCTGGCGGGGCCTGCAGGACCTGA 
ALKI PEQYR'HTIWRGLQDLK 
AGCAGGGCCACGACTACGGCGCCGCCGCOCfcGCAGCTGCTCCGCTCCAGCAACGCGGCCG 
QGHDYGAAAQQLLRSSNAAA 
CCATTTCCATCGGCGGCTCCGGGGACCTGCAGCGCCAGCGGGTCATGGAGGCCGTGCACT 
lSlGGSGEL r ORQRVMEAVHF 
TCCGCGTGCGCCACACCATCACCATCOCQMOCGCGGCGGCCCCGGCGCCGGCCCCGACG 
RVRHTITI*"*RGGPGAGPDE 



WADFGFPLPDCKARKQPIKE 
AGGAGTTCACGGAGGCCGAGATCCACTGAGGGGCCGGGCCCAGCCAGAGCCTGTGCCACC 

EFTEAEXH* 
GCCCAGAGACCCAGGCCGCCTCGCTCTCCTTCCTGTGTCCAAAACTGCCTCCGGAGGCAG 
GGCCTCCAGGCTGTGCCCGGGGAAAGGCAAGGTCCGGCCCATGCCCCGGCACCTCACCGG 
CCCCAGGAGAGGCCCAGCCACCAAAGCCGCCTGCGGACAGCCTGAGTCACCTGCAGAACC 
TTCTGGAGCTGCCCTAATGCTGGG C TTGC OG GGCAGGGGCCGGCCCACTCTCAGCCCTGC 
CACTGCCGGGCGTGCTCCATGGCAGGCGTGGGTGGGGACCGCAGTGTCAGCTCCGACCTC 
CAGGCCTCATCCTAGAGACTCTGTCATCTGCCGATCAAGCAAGGTCCTTCCAGAGGAAAG 
AATCCTCTTCGCTGGTGGACTGCCAAAAAGTATTTTGCGACATCTTTTGGTTCTGGAGAG 
TGGTGAGCAGCCAAGCGACTGTGTCTGAAACACCGTGCATTTTCAGGGAATGTCCCTAAC 
GGGCTGGGGACTCTCTCTGCTGGACTTGGGAGTGGCCTTTGCCCCCAGCACACTGTATTC 
TGCGGGACCGCCTCCTTCCTGCCCCTAACAACCACCAAAGTGTTGCTGAAATTGGAGAAA 
ACTGGGGAAGGCGCAACCCCTCCCAGGTGCGGGAAGCATCTGGTACCGCCTCGGCCAGTG 
CCCCTCAGCCTGGCCACAGTCACCTCTCCTTGGGGAACCCTGGGCAGAAAGGGACAGCCT 
GTCCTT AGAGGACCGGAAATTGTC AATATTTGATAAAATGATACCCTTTTCT AC 2 87 4 
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1S0O 

549 
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569 

1920 

589 

1980 

609 

2040 

629 

2100 
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2160 

2220 

2280 
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2400 
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252 0 

2580 

2640 

2700 
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1 


TGCCTCCCCGCCCGCGCACCCGCCCCGAGGCCTGTGCTCCTGCGAAGGGGACGCAGCGAA 


60 


61 


GCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATGCCCGGAGCTGCGACGGCTGC 


120 


121 


AGAGCGAGCTGCCCTCGGAGGCCGGTGTGAGGAAGATGGCCCAGTCCACCACCACCTCCC 


180 


- 10 


MAQSTTTS P 


9 


131 


CCGATGGGGGCACCACGTTTGAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACT 


24 0 


10 


DGGTTFEHLWSSLE PDSTYF 


29 


2 41 


TCGACCTTCCCCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 


3 00 


30 


DLPQSSRGNNEVVGGTDSSM 


49 


301 


TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTCAATTTGCTGA 


360 


50 


DVFHLEGMTTSVMAQFNLLS 


69 


361 


GCAGCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGGCCAGCCCGTACACCCCGGAGC 


420 


7 0 


STMDQMSSRAASAS PYTPEH 


99 


421 


ACGCCGCCAGCGTGCCCACCCATTCACCCTACGCACAGCCCAGCTCCACCTTCGACACCA 


480 


90 


AASVPTHSPYAQPS STFDTM 


109 


4 91 


TGTCGCCCGCGCCTGTCATCCCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGG 


540 


110 


SPAPVIPSNTDYPGPHHFEV 


129 


541 


TCACTTTCCAGCAGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTGA 


500 


130 


TFQQSSTAKSATWTYSPLLK 


149 


601 


AGAAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTGTCCGCCCCAC 


660 


150 


KLYCQIAKTCPIQIKVSAPP 


169 


6 51 




720 


170 


P P G T A I RAM P * V Y K K AEHVT D 


189 


721 


ACATCGTGAAGCGCTGCCCCAACCACGAOCTCGGGAGGGACTTCAACGAAGGACAGTCTG 


780 


190 


IVKRC PNHELGRDFNEGQSA 


209 


7 31 


CCCCAGCCAGCCACCTCATCCGTGTGGAAGGCAATAATCTCTCGCAGTATGTGGACGACC 


840 


2 10 


PASHL IRVEGNNL SQYVDDP 


229 


841 


CTGTCACCGGCAGGCAGAGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGACAGAAT 


900 


230 


VTGRQSVVVPYEPPQVGTEF 


249 


901 


TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGCATGAACCGAC 


960 


250 


TT I LYNFMCNSSCVGGMNRR 


269 


961 


GGCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGGGCAGGTGCTGGGCCGCCGGT 


1020 


270 


P ILI I ITLETRDGQVLGRRS 


289 


10 21 


CCTTCGAGGGCCGCATCTGCGCCTGTCCTGGCCGCGACCGAAAAGCCGATGAGGACCACT 


1080 


290 


F EGRI CAC PGRDRKADEDHY 


309 


1031 


ACCGGGAGCAGCAGGCCTTGAATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCG 


1140 


3 13 


R EQQALNES SAKNG AAS K RA' 


329 


1141 


CCTTCAAGCAGAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 


1200 


3 30 


FKQS P PAVPALG PGVKKRRH 


349 


1201 


ACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTTCGAGATCCTGA 


1260 


350 


GDEDTYYLQVRGRENFEILM 


369 


1Z61 


TGAAGCTGAAGGAGAGCCTGGAGCTGATGGAGTTGGTGCCGCAGCCGCTGGTAGACTCCT 


1320 


37: 


KLKESLELMELVPQPLVDSY 


339 




- £TCGGCAGCAGCAGCAGCTCCTACAGAC*GCCGAGTCACCTACAGCCCCCATCCTACGGGC 


1330 


3 90 


-R QQQQLLQRPSHL.QPPSYGP 


409 


1 3 8 1 


. CGGTfcCTCTCGCCCATGAACAAGGTGCACGGGGGCGTGAACAAGCTGCCCTCCGTCAACC 


1440 


* - ~\ 


V L S P M N K V H G G V N K L P S V N Q 


429 


1441 


A^CTGGTGGGCCAGCCTCCCCCGCACAGCTCGGCAGCTACACCCAACCTGGGACCTGTGG 


1500 


4 30 


LVGQPPPHSSAATPNLGPVG 


449 




GCTCTGGGATGCTCAACAACCACGGCCACGCAGTGCCAGCCAACAGCGAGATGACCAGCA 


1560 


-i 5 0 


SGMLNNHGHAVPANSEMTSS 


4 69 


15 61 


GCCACGGCACCCAGTCCATGGTCTCGGGGTCCCACTGCACTCCGCCACCCCCCTACCACG' 


1620 




HGTQSMVSGSHCTPPPP'THA 


489 




CCGACCCCAGCCTCGTCAGGACCTGGGGGCCCTGAAGATCCCCGAGCAGTATCGCATGAC 


1680 


~Y?l 


0 ? S L V R 7 W G ? 


509 


15 51 


CATCTGGCGGGGCC7GCAGGACCTGAAGCAGG3CCACGACTACGGCGCCGCCGCGCAGCA 


1740 


— -t * 


GCTGCTCCGC7CCAGCAACGCGGC CGCCATTTCCATCGGCGGCTCCGGGGAGC7GCAGCG 


1300 




CCAGCGGG7CATGGAGGCCGTGCACTTCCGCGTGCGCCACACCATCACCATCCCCAACCG 


1360 




CGGCGGCCCCGGCGCCGGCCCCGACGAGTGGGCGGACTTCGGCTTCGACCTGCCCGACTG 


1920 




CAAGGCCCGCAAGCA3CCCA7CAAGGAGGAGTTCACGGAGGCCGAGATCCACTGAGGGGC 


1930 


1 9 ? 1 


CGGGCCCAGCCAGAGCCTGTGCCACCGCCCAGAGACCCAGGCCGCCTCGCTCTC 20 34 
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1 GCG AGCTGCCCTCGGAGGCCGGCGTGGGGAAGATGGCCC AGTCC ACCGCCACCTCCCCTG 6 0 

_9 MAQSTATSPD 10 

5 1 ATGGGGGCACCACGTTTG AGCACCTCTGGAGCTCTCTGGAACCAGAC AGCACCTACTTCG 12 0 

11 GGTTFEHLWSSLEPDSTYFD 30 

121 ACCTTCCCC AGTC AAGCCGGGGGAAT AATG AGGTGGTGGGcGG AACGGATTCC AGC ATGG 1 8 0 * 

31 LPQSSRGNNEVVGGTDSSMD 50 

181 ACGTCTTCCACCTGGAGGGCATGACTAC ATCTGTCATGGCCC AGTTCAATCTGCTGAGCA 24 0 

51 VFHLEGMTTSVMAQFNLLSS 70 

241 GCACCATGGACCAGATGAGCAGCCGCGCGGCCTCGGCCAGCCCCTACACCCCAGAGCACG 3 00 

71 TMDQMS 3RAASASPYTPEHA 90 

301 CCGCCAGCGTGcCCACCCAcTCGCCCTACGCACAACCCAGCTCCACCTTCGACACCATGT 3 60 

91 ASVPTH5PYAQPSSTFDTMS 110 

3 61 CGCCGGCGCCTGTCATCCCCTCCAACACCGACTACCCCGGACCCCACCACTTTGAGGTCA 42 0 

HI PAPVI PSNTDYPGPHHFEVT 130 

421 CTTTCC AGC AGTCC AGC ACGGCCAAGTCAGCCACCTGGACGTACTCCCCGCTCTTGAAGA 4 80 

131 FQQSSTAKSATWTYSPLLKK 150 

481 AACTCT ACTGCC AGATCGCCAAGACATGCCCCATCCAGATC AAGGTGTCCACCCCGCCAC 54 0 

151 LYCQIAKTCPIQIKVSTPPP 170 

541 CCCC AGGC ACTGCC ATCCGGGCCATGCCTGTTT AC AAGAAAGCGGagcACGTGACCGACG 600 

171 PGTA I RAMPVYKKAEHVTDV 190 

601 TCGTGAAACGCTGCCCCAACCACGAGCTCGGGAGGGACTTC AACGAAGGACAGTCTGCTC 66 0 

191 VKRC PNHELGRDFNEGQSAP 210 

661 CAGcCAGCCACCTCATCCGCGTGGAAGGCAATAATCTCTCGCAGTATGTGGATGACCCTG 7 2 0 

211 ASHL I RVEGNNLSQYVDDPV 230 

721 TC ACCGGCAGGCAGAGCGTCGTGGTGCCCT ATGAGCC ACCACAGGTGGGGACGGAATTCA 7 8 0 

231 TGRQSVVVPYEPPQVGTEFT 250 

7 81 CC ACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTAGGGGGC ATGAACCGGCGGC 840 

251 TILYNFMCNSSCV.GGMNRRP 270 

841 CC ATCCTC ATC ATCATC ACCCTGGAG ATGCGGGATGGGC AGGTGCTGGGCCGCCGGTCCT 900 

271 IL I I ITLEMRDGQVLGRRSF 290 

901 TTGAGGGCCGC ATCTGCGCCTGTCCTGGCCGCGACCGAAAAGCTGATGAGGACCACTACC 96 0 

291 EGRICACPGRDRKADEDHYR 310 

961 GGGAGCAGC AGGCCCTGAACGAGAGCTCCGCCAAGAACGGGGCCGCCAGCAAGCGTGCCT 1020 

311 EQQALNESSA.KNGAASKRAF '3 3 0 

1021 TC AAGCAGAGCCCCCCTGCCGTCcCCGCCCTTGGTGCCGGTGTGAAGAAgCGGCGGCATG 10 80 

331 KQS PPAVPALGAGVKKRRHG ^350 

1081 G AGACGAGGAC ACGT ACT ACCTTC AGGTGCGAGGCCGGG AG AACTTTG AGATCCTGATGA 1 1 4 C 

351 DEDTYYLQVRGRENFE I LMK 370 

1141 AGCTGAAAGAGAGCCTGG AGCTGATGGAGTTGGTGCCGCAGCCACTGGTGGACTCCT ATC 12 00 

37 1 LKESLELMELVPQPLVDSYR 390 

1201 GGCAGC AGC AGC AGCTCCTACAGAGGCCGAGTCACCTACAGCCCCCGTCCTACGGGCCGG 12 60 

391 QQQQLLQRPSHLQPPSYGPV 410 

12 61 TCCTCTCGCCCATGAACAAGGTGC ACGGGGGC ATGAACAAGCTGCC.C7CCGTCAACCAGC 13 2 0 
411 LSPMNKVHGGMNKLPSVNQL 430 

13 2 1 TGGTGGGCCAGCCTCCCCCGCACAGTTCGGCAGCTACACCCAACCTGGGGCCCGTGGGCC 13 3 0 
431** VGQPPPHSS-AATPNLGPVGP 450 

1 3 S 1 CCGGGATGcTC AACAACC ATGG cCACGCAGTGc CAGCCAaCGGCGAGATGAGC AGC AGCC 14 4 0 

45 1" GMLNNHGHAVPANGEMSSSH 47 0 

14 41 ?ACAGCGCCCAGTCC ATGGTCTCGGGGTCCCACTGcACTCCGCCACCCCCCTACCACGCCG 150 0 
47 1 SAQSMVSGSHCTPPPPYHAD 4 90 

1501 ACCCCAGCCTCGTCAGTTTTTT AACAGGATTGGGGTGTCCAAACTGC ATCGAGTATTTC A 15 6 0 

491 PSLVSFLTGLGCPNCI EYFT 510 

1561 CCTCCCAAGGGTTACAGAGCATTTACCACCTgcAGAACcTGACcATTGAGGACCTGGGGG 162 0 

511 SQGLQS IYKLQNLT I E D _L G A 530 

16 21 CCCTGAAGATCCCCGAGCAGTACCGCATGACCATCTGGCGGGGCCTGCAGGACCTGAAGC 15 3 0 

531 LK I PEQYRMTIWRGLCDLKQ 550 

16 31 AGGGCCACGACTACAGCACC3CGCAGCAGCTGCTCCGCTCTAGCAACGCGGCCACCATCT 1^40 
551 G H D v S T A Q Q L L. R S S N A A T I S 57 0 

17 4 1 CCATCGGCGGCTCAGGGGAACTGCAGCGCCAGCGGGTCATGGAGGCCGTGCACTTCCGCG 13 0 0 
571 IGGSGE-QRQRVMEA7HFR V 5 90 

15 01 TGCGCCACACCATCACCATCCCCAACCGCGGCGGCCCAGGCGGCGGCCCTGACGAGTGGG 13 6 0 
591 rhTIT:?NRGG?GGG?DEWA 510 

13 51 CGGACTTCGGCTTCGACCTGCCCGAC7GCAAGGCCCGC AAGCAGCCCATCAAGGAGGAGT 192 0 

611 DFGFD* POCKARKQPIKEcF 530 

- 1-9-2 1 TCACC^AGGCCGAGATCCAC-TGAGSGCCTCGCCTGGCTGCAGCCTGCGCCACCGCCCAGA 1980 

631 T E A E I H ° = 0 

19 3-1 GACCCAAGCTGCCTCCCCT^TCCTTCCTGTGTGTCCA-AAACTGCCTCAGGAGGCAGGACC ^040 

2041 TTCGGGCTGTGCCCGGGGAAAGGCAAGGTCCGGCCCATCCCCAGGCACCTCACAGGCCCC^ ^ -1°° 

2101 AGGAAAGGCCCAGCCACCGAAGCCGCCTGTGGACAGCCTGAGTCACCTGCAGAACC 215 5 
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1 TGATCTCCCTGTGGCCTGC AGGGGACTGAGCCAGGGAGTAGATGCCCTGAGACCCC AAGG 6 0 

6 1 GACACCCAAGGAAACCTTGCTGGCTTTGAGAAAGGGATCGTCTCTCTCCTGCCCAAGAGA 120 

121 AGCATGTGTATGGGCCCTGTGTATGAATCCTTGGGGCAGGCCCAGTTCAATTTGCTCAGC 180 

0 MCMG ? V Y E SLGQAQFNLLS 19 

181 AGTGCCATGGACCAGATGGGCAGCCGTGCGGCCCCGGCGAGCCCCTACACCCCGGAGCAC 24 0 

20 SAMDQMGSRAA PAS PYTPEH 39 

241 GCCGCCAGCGCGCCCACCCACTCGCCCTACGCGCAGCCCAGCTCCACCTTCG ACACCATG 300 

40AASAPTHSPYAQPSSTFDTM 59 

3 01 TCTCCGGCGCCTGTCATCCCTTCCAATACCGACTACCCCGGCCCCCACCACTTCGAGGTC 3 60 

60 SPAPVIPSNTDYPGPHHFEV 79 

3 61 ACCTTCC AGCAGTCGAGCACTGCC AAGTCGGCCACCTGGACATACTCCCC ACTCTTG AAG 42 0 
80 T FQQ S STAK SATWTYS PL LK 99 

4 21 AAGTTGTACTGTCAGATTGCTAAGACATGCCCCATCCAGATCAAAGTGTCCACACCACCA 480 
100 KLYCQIAKTCPIQIKVSTPP 119 

4 81 CCCCCGGGC ACGGCCATCCGGGCCATGCCTGTCTACAAGAAGGCAGAGCATGTGACCGAC 54 0 
120 PPGTAI RAMPVYKKAEHVTD 139 

5 41 ATTGTT AAGCGCTGCCCC AACC ACG AGCTTGGAAGGG ACTTC AATGAAGG AC AGTCTGCC 60 0 
140 I VKRC PNHELGRDFNEGQSA 159 
601 CCGGCTAGCCACCTCATCCGTGTAGAAGGCAACAACCTCGCCCAGTACGTGGATGACCCT 660 
160 PASHL I RVEGNNLAQYVDDP 179 
661 GTCACCGGAAGGC AGAGTGTGGTTGTGCCGTATGAACCCCCACAGGTGGG AACAGAATTT 72 0 
180 VTGRQ SVVV PY E P P Q V G T EF 19 9 
7 21 ACC ACC ATCCTGTACAACTTC ATGTGTAAC AGC AGCTGTGTGGGGGGC ATGAATCGGAGG 78 0 
200 TT ILYNFMCNS SCVGGMNRR 219 
7 81 CCCATCCTTGTCATCATCACCCTGGAGACCCGGGATGGACAGGTCCTGGGCCGCCGGTCT 84 0 
220 P I LV I ITLETRDGQVLGRRS 239 
841 TTCGAGGGTCGCATCTGTGCCTGTCCTGGCCGTGACCGCAAAGCTGATGAAGACCATTAC 90 0 
240 FEGR ICACPGRDRKADEDHY 259 
901 CGGGAGCAACAGGCTCTGAATGAAAGTACCACCAAAAATGGAGCTGCCAGCAAACGTGCA 960 
260 REQQALNESTTKNGAASKRA 279 
961 TTCAAGCAGAGCCCCCCTGCCATCCCTGCCCTGGGTACCAACGTGAAGAAGAGACGCCAC 10 20 
280 FKQS PPAI PALGTNVKKRRH 299 

102 1 GGGGACGAGGACATGTTCTACATGCACGTGCGAGGCCGGGAGAACTTTGAGATCTTGATG 10 80 

300GDEDMFYMHVRGRENFEILM 319 

108 1 AAAGTCAAGGAGAGCCTAGAACTGATGGAGCTTGTGCCCCAGCCTTTGGTTGACTCCTAT 1140 

320 KVKESLELMELVPQPLVDSY 339 

114 1 CGACAGCAGCAGCAGC AGCAGCTCCTACAGAGGCCG AGTC ACCTGC AGCCTCCATCCTAT 12 00 

340 RQQQQQQLLQRPSHLQPPSY 359 

1201 GGGCCCGTGCTCTCCCCAATGAACAAGGTACACGGTGGTGTCAACAAACTGCCCTCCGTC 12 60 

360G PVLS PMNKVHGGVNKLPSV 37 9 

1261 AACCAGC7GGTGGGCCAGCC7CCCCCGCACAGCTCAGCAGCTGGGCCCAACCTGGGGCCC 13 20 

330 NQ LVGQ ? P P H S SAAGPNLGP 399 

1321 ATGGGCTCCGGGATGCTCAACAGCCACGGCCACAGCATGCCGGCCAATGGTGAGATGAAT 13 80 

400 . fc M 3 5 G M L N S K _G H S M P A N G E M N 419 

1331 GGAGGCCACAGCTCCCAGACCATGGTTTCGGGATCCCACTGcACCCCGCCACCCCCCTAT 14 4 0 

420. G C H S S Q ~ M '■' S G S H C T P P ? P Y 439 

144 1 CA7GcAGACCCCAGCC7C3TCAGT7TT7TGACAGGGTTGGGGTGTCCAAACTGCATCGAG 15 00 

44 0 Ra*DPSLVSFLTGLGCPNCIE 45 9 

1501 TGC7TCAC7TCCCAAGGG7TGCAGAGCATCT ACC ACCTGC AG AACCTTACCATCGAGGAC 15 60 

460 CFTSQGLQS IYHLQNLTIED 479 

15 51 C7TGGGGC7CTGAAGGTCCCTGACCAGTACCGTATGACCATCTGGAGGGGCCTACAGGAC 16 20 
430 LGALK VPDQYRMT IWRGLQD 499 

162 1 CTGAAGCAGAGCCATGACTGCGGCCAGCAACTGCTACGCTCCAGCAGCAACGCGGCCACC 16 80 

500 L K Q S H DCGQQL LR S S SNAAT 519 

16 31 ATC7CCATCGGCGGCTC7GGCGAGCTGCAGCGGCAGCGGGTCATGGAAGCCGTGCA7TTC 17 40 
52 0 I S I G G S 3 E L 0 R Q R V M E A V H F 53 9 

174 1 CGTGTGCGCCACACCATCACA.=iTCCCCAACCGTGGAGGCGCAGGTGCGGTGACAGGTCCC 13 CO 

540 R V R H T I 7 I ? N R G 3 A G A V T 3 ? 559 

13 01 GACGAGTGGGCGGAC7TTGGCTTTGACCTGCCTGACTGCAAGTCCCGTAAGCAGCCCATC 13 60 

5 6 0 D E W A D F 3 F D L ? D C K S R K Q PI 57 9 

13 51 AAAGAGGAGTTCACAGAGACAGAGAGCCACTGAGGAACGTA.CC7TCT7CTCCTGTCCT7C 19 2 0 

530 KEEFTE7E-SH* . 599 

192 1 CTC7GTGAGAAACTGC7C7TGGAAGTGGGACC7G77GGCTG7GCCCACAGAAACCAGCAA 19 30 

1 9-3'i GGACCTTCTGCCGGA7GCCATTCC7GAAGGGAAG7CGCTCATG.=iACTAACTCCCTC7TGG 2040 
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1 TGGTCCCGCTTCGACCAAGACTCCGGCTACCAGCTTGCGGGCCCCGCGGAGGAGGAGACC 6 0 

6 1 CCGCTGGGGCTAGCTGGGCGACGCGCGCCAAGCGGCGGCGGGAAGGAGGCGGGAGGAGCG 120 

121 GGGCCCG AGACCCCGACTCGGGC AG AGCC AGCTGGGGAGGCGGGGCGCGCGTGGG AGCCA 180 

181 GGGGCCCGGGTGGCCGGCCCTCCTCCGCCACGGCTGAGTGCCCGCGCTGCCTTCCCGCCG 2 40 

241 GTCCGCCAAGAAAGGCGCTAAGCCTGCGGCAGTCCCCTCGCCGCCGCCTCCCTGCTCCGC 3 00 

301 ACCCTTATAACCCGCCGTCCCGCATCCAGGCGAGGAGGCAACGCTGCAGCCCAGCCCTCG 3 60 

3 61 CCGACGCCGACGCCCGGCCCGGAGCAGAATGAGCGGCAGCGTTGGGGAGATGGCCCAGAC 42 0 

-g MSGSVGEMAQT 11 

421 CTCTTCTTCCTCCTCCTCCACCTTCGAGCACCTGTGGAGTTCTCTAG AGCCAGACAGCAC 4 80 

12 SSSSSSTFEHLWSSLEPDST 31 

481 CTACTTTG ACCTCCCCCAGCCC AGCC AAGGGACTAGCGAGG CATC AGGCAGCGAGGAGTC 540 

32 YFDLPQPSQGTSEASGSEES 51 

541 CAACATGGATGTCTTCCACCTGCAAGGCATGGCCCAGTTCAATTTGCTCAGCAGTGCCAT 600 

52 NMDVFHLQGMAQFNLLS SAM 71 

601 GGACC AGATGGGCAGCCGTGCGGCCCCGGCGAGCCCCTAC ACCCCGGAGC ACGCCGCCAG 660 

72 DQMGSRAAPASPYTPEHAAS 91 

661 CGCGCCCACCCACTCGCCCTACGCGCAGCCCAGCTCCACCTTCGACACCATGTCTCCGGC 7 20 

92 APTHSPYAQPSSTFDTMSPA 111 

7 21 GCCTGTCATCCCTTCCAATACCG ACTACCCCGGCCCCC 7 58 

112 PVI PSNTDYPGP 123 
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1 50 

sr-p70a-cos3 MAQ 3TTTSPDGGT TFEHLWSSLE PDSTYFDLPQ SSRGNNEWG 

sr-p70b-cos3 MAQ STTTSPDGGT TrEHLWSSLE PDSTYFDLPQ S S RGNNEWG 

sr-p70-ht29 MAQ 5TATSPDGGT TrEHLWSSLE PDSTYFDLPQ SS RGNNEWG 

sr-p70c-att20 

sr-p70a-att20 MSGSVGEMAQ ...TSSSSSS TrEHLWSSLE PDSTYFDLPQ PSQGTSEASG 

51 100 

sr-p70a-cos3 GTDSSMD.VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

Sr-p70b-cos3 GTDSSMD.VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

sr-p70-ht29 GTDSSMD.VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

sr-p70c-att20 . . .MCMGPVY . . ESLG . . .Q AQFNLLSSAM DQMGSRAAPA SPYTPEHAAS 

sr-p70a-att20 SEESNMD.VF HLQGM AQFNLLSSAM DQMGSRAAPA SPYTPEHAAS 

101 150 
Sr-p70a-cos3 VPTHSPYAQP S5TFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 
sr-p70b-cos3 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 
sr-p70-ht29 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 
_sr-p70c-att20 APTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 
sr-p70a-att20 APTHSPYAQP SSTFDTMSPA PVIPSNTDYP GP 

151 200 
Sr-p70a-cos3 TYSPLLKKLY CQIAKTCPIQ IKVSAPPPPG TAI RAMPVYK KAEHVTDIVK 
sr-p70b-cos3 TYSPLLKKLY CQIAKTCPIQ IKVSAPPPPG TAI RAMPVYK KAEHVTDIVK 
sr-p70-ht29 TYSPLLKKLY CQIAKTCPIQ IKVSTPPPPG TAI RAMPVYK KAEHVTDWK 
sr-p7 0c-att20 TYSPLLKKLY CQIAKTCPIQ IKVSTPPPPG TAI RAMPVYK KAEHVTDIVK 
sr-p70a-att20 



sr-p70a-cos3 
sr-p70b-cos3 
sr-p70-ht29 
sr-p70c-.att20 
sr-p70a-att20 



sr-p7 0 a -"cos 3 
sr-p7 0b-cos3 
sr-p70-ht29 
sr-p70c-att20 
sr-p70a-att20 



sr-p70a-cos3 
sr-p7 0b-cos3 
sr-p70-ht29 
sr-p70c-att20 
sr-p70a-att20 



201 250 

RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSVWPYEP 

RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSVWPYEP 

RCPNHELGRD FNEGQSAPAS r.LZ RVEGNNL SQYVDDPVTG RQSVWPYEP 

RCPNHELGRD FNEGQSAPAS^ HLIRVEGNNL AQYVDDPVTG RQSVWPYEP 

251 300 

PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL I IITLETRDG QVLGRRSFEG 

PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL I IITLETRDG QVLGRRSFEG 

PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL I I ITLEMRDG QVLGRRSFEG 

PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL V IITLETRDG QVLGRRSFEG 



301 

RICAC PGRDR FADEDKYREQ 
RICACPGRDR KADEDHYREQ 
RICACPGRDR KADEDHYREQ 



350 

-NESSAKN GAASKRAFKQ SPPAVPALGP 
-NESSAXN GAASKRAFKQ SPPAVPALGP 
W^NESSAXN GAASKRAFKQ SPPAVPALGA 



RICACPGRDR KADEDHYREQ QALNESTTKN GAASKRAFKQ SPPAIPALGT 
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CVKKRRHGDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR. . 
^RRHGDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR. . 
GV^KrISgDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR. . 
Sv^KRrS SmFYmSvRGR ENFEILMKVK ESLELMELVP QPLVDSYRQQ 



400 



\ sr-p70a-cos3 
sr-p70b-cos3 
sr-p70-ht29 
~sr-p70c-ate20 
"sr-p70a-att20 



] sr-p70a-cos3 
sr-p70b-cos3 
sr-p70-hc29 
~sr-p70c-act20 
"sr-p70a-att20 



onnoLLORPS HLQPPSYGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 

OOOO LLQRP S HLQPPSYGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 

^LLORPS HLQPPSYGPV LSPMNKVHGG MNKLPSVNQL VGQPPPHSSA 

qSqLLQRPS HLQPpIyGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 



450 



451 500 
~ ,r o70a-cos3 ATPNLGPVGS GMLNNHGHAV PANSEMTSSH GTQSMVSGSH CTPPPPYHAD 
" Ir nlQb-tltl ATPNLGPVGS GMLNNHGHAV PANSEMTSSH GTQSMVSGSH CTPPPPYHAD 
~ «;?B70-ht29 ATPNLGPVGP GMLNNHGHAV PANGEMS S SH SAQSMVSGSH CTPPPPYHAD 
Isr-p70c-at"o AGPNLGPMGS GMLNSHGHSM PANGEMNGGH SSQTMVSGSH CTPPPPYHAD 
_sr-p70a-att20 

501 550 
I sr-p70a-cos3 PSLVSFLTGL GCPNCIEYFT SQGLQSIYHL QNLTIEDLGA LKIPEQYRMT 

" S sr-D70-ht!9 pIlvIfLTGl" GCPNCIEYFT SQGLQSIYHL QNLT IEDLGA LKIPEQYRMT 
Isr-p70c- a ct20 PSLVSFLTGL GCPNCIECFT SQGLQSIYHL QNLTIEDLGA LKVPDQYRMT 

_sr-p70a-att20 

600 

I sr-p70a-cos3 IWRGLQDLKQ GHDYGAAAQQ LLR.SSNAAA ISIGGSGELQ RQRVMEAVHF 

" S ^: P l7n"hr-9 IWRGLQDLKQ GHDYs'.TAQQ LLr'.SSNAAT ISIGGSGELQ RQRVMEAVHF 
-sr- P 7?c-;tt20 I-SqDLKQ SHDCG. . .QQ LLRSSSNAAT ISIGGSGELQ RQRVMEAVHF 

_sr-p70a-att20 '/ 

650 

I sr->0a-cos3 RVRHTITIPN RGGPGA". .GP DEWADFGFDL PDCKARKQPI KEEFTEAEIH 

" S = ^ P o7n"hr-9 RVRHTITIPN RGGPGG^'.GP DEWADFGFDL PDCKARKQPI KEEFTEAEIH 
:,r-p^c-«\20 RVR^TI?"n RGGAGAVTGP DEWADFGFDL PDCKSRKQPI KEEFTETESH 

_sr -p70a-acc20 
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REVINDICATIONS 



1. Polypeptide purifie, comprenant une sequence d'acides amines choisie 
parmi : 

a) la sequence SEQ ID n° 2 ; 

b) la sequence SEQ ID n° 4 ; 

c) la sequence SEQ ID n° 6 ; 

d) la sequence SEQ ID n° 8 ; 

e) la sequence SEQ ID n° 10 ; 

f) toute sequence biologiquement active derivee de SEQ ID n° 2, SEQ ID 
n° 4, SEQ ID n° 6, SEQ ID n° 8 ou SEQ ID n° 10. 

2. Polypeptide selon la revendication 1, caracterise en ce qu'il comprend la 
sequence d'acides amines SEQ ID n° 6. 

3. Polypeptide selon la revendication 1 , caracterise en ce qu'il comprend la 
sequence comprise entre : 

- le residu 1 10 et le residu 310 de SEQ ID n° 2, 4 ou 6 ; 

- le residu 60 et le residu 260 de SEQ ID n° 8 ; 

- le residu 109 et le residu 123 de SEQ ID n° 10. 

4. Polypeptide selon la revendication 1, caracterise en ce qu'il resulte d'un 
epissage altematif de TARN messager du gene correspondant. 

5. Polypeptide selon I'une quelconque des revendications precedentes, 
.caracterise en ce qu'il s'agit d'un polypeptide recombinant produit sous la 
tonne d'une proteine de fusion. 

6. Sequence d'acides nucleiques isolee codant pour un polypeptide selon 
Tune quelconque des revendications precedentes. 

7. Sequence d'acides nucleiques isolee selon la revendication 6, caracte- 
risee en ce qu'elle est choisie parmi : 

a) la sequence SEQ ID n? 1 ; 

b) la sequence SEQ ID n° 3 ; 

c) la sequence SEQ ID n° 5 ; 
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d) la sequence SEQ ID n°7 ; 

e) la sequence SEQ ID n°9 ; 

f) les sequences d'acides nucleiques capables de s'hybrider a la 
sequence SEQ ID n° 1, SEQ ID n° 3, SEQ ID n° 5, SEQ ID n°7 ou SEQ 
ID n°9 ou a leurs sequences complementaires, ou de s'hybrider a leurs 
sequences proximales.; 

g) les sequences derivees des sequences a), b), c), d), e) ou f) du fait de 
la degenerescence du code genetique. 

8. Sequence nucleotidique selon la revendication 6, caracterisee en ce qu'il 
s'agit de la sequence SEQ ID n° 5 codant pour le polypeptide de sequen- 
ces SEQ ID n° 6. 



9. Vecteur de clonage et/ou d'expression contenant une sequence d'acides 
nucleiques selon Tune quelconque des revendications 6 a 8. 

10. Vecteur selon la revendication 9 f caracterise en ce qu'il s'agit du plasmide 
pSE-1. 

1 1 . Cellule bote transfectee par un vecteur selon la revendication 9 ou 10. 

12. Cellule hote transfectee selon la revendication 11, caracterisee en ce qu'il 
s'agit de E. coli MC 1061. 

13: Sonde nucleotidique ou amorce nucleique caracterisee en ce qu'elle 
r s'hybride specifiquement avec Tune quelconque des sequences selon les 
revendications 6 a 8 ou leurs sequences complementaires ou les ARN 
messagers correspondants ou les genes correspondants. 

14. Sonde selon la revendication 13, caracterisee en ce qu'elle comporte au 
moins 10 nucleotides. 



15. Sonde selon la revendication 13, caracterisee en ce qu'elle comprend 
I'integralite de la sequence du gene codant pourJ-un des polyeptides de la 
revendication 1. 



16. Sondes nucleotides ayant les oligonucleotides suivants ou leurs 
complementaires : 

SEQ ID n° 1 1 : GCG AGC TGC CCT CGG AG 
SEQ ID n° 12 : GGT TCT GCA GGT GAC TCA G 
SEQ ID n° 13 : GCC ATG CCT GTC TAC AAG 
SEQ ID n° 14 : ACC AGC TGG TTG ACG GAG 
SEQ ID n° 15 : GTC AAC CAG CTG GTG GGC CAG 
SEQ ID n° 16 : GTG GAT CTC GGC CTC C 

17. Utilisation d'une sequence selon I'une quelconque des revendications 6 a 
8 pour la fabrication d'amorces oligonucleotidiques pour des reactions de 
sequencage ou d'amplification specifique selon la technique de PCR ou 
toute variante de celle-ci. 

18. Couple d'amorces nucleotidiques, caracterise en ce qu'il comprend les 
amorces de sequences suivantes : 

a) SEQ ID n° 1 1 

amorce sens : GCG AGC TGC CCT CGG AG 

SEQ ID n° 12 
amorce antisens : GGT TCT GCA GGT GAC TCA G 

b) SEQ ID n°13 

amorce sens : GCC ATG~CCT GTC TAC AAG 

SEQ ID n° 14 
amorce antisens : ACC AGC TGG TTG ACG GAG 

c) SEQ ID n° 15 

amorce sens : GTC AAC CAG CTG GTG GGC CAG 

SEQ ID n° 16 
amorce antisens : GTG GAT CTC GGC CTC C _ . .. 



55 



Documents recus 
le : A 0 - /U- ^ £ 



Non examines par 
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19. Utilisation d'une sequence selon Tune quelconque aes rttveMUiLcUiui!i> '6 a 
8, pour la realisation de sondes nucleotidiques de diagnostic ou de 
sequences antisens utilisables en therapie genique. 

20. Utilisation d'une sonde selon Tune quelconque des revendications 13 a 
16, comme outil de diagnostic in vitro pour la detection, par des experien- 
ces d'hybridation, des sequences d'acides nucleiques codant pour un 
polypeptide selon Tune quelconque des revendications 1 a 4, dans des 
echantillons biologiques, ou pour la mise en evidence de syntheses 
aberrantes ou d'anomalies genetiques. 

21. Methode de diagnostic in vitro pour la detection de syntheses aberrantes 
ou d'anomalies genetiques au niveau des sequences d'acides nucleiques 
codant pour un polypeptide selon I'une quelconque des revendications 1 
a 4, caracterisee en ce qu'elle comprend : 

- la mise en contact d'une sonde nucleotidique selon Tune quelconque 
des revendications 13 a 16 avec un echantillon biologique dans des 
conditions permettant la formation d'un complexe d'hybridation entre 
ladite sonde et la susdite sequence nucleotidique, eventuellement apres 
une etape prealable d'amplification de la susdite sequence nucleotidique ; 

- la detection du complexe d'hybridation eventuellement forme ; 

- eventuellement le sequen?age de la sequence nucleotidique formant le 
complexe d'hybridation avec la sonde de ('invention. 

22r Utilisation d'une sequence d'acides nucleiques selon I'une quelconque 
des. revendications 6 a 8, pour la production d'un polypeptide recombinant 
selon I'une quelconque des revendications 1 a 5. 



23. Methode de production d'un polypeptide selon I'une quelconque des 
revendications 1 a 5 recombinant, caracterisee en ce que Ton cuttive des 
cellules transferees selon la revendication 11 ou 12 dans des conditions 
permettant I'expression d'un polypeptide recombinant de sequence SEQ 
ID n° 2, SEQ ID n° 4, SEQ ID n°6, SEQ ID n° 8 ou SEQ ID n° 10 ou tout 
fragment ou derive biplogiquement actif, et _.que Ton recupere- ledit 
polypeptide recombinant. 
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24. Anticorps mono ou polyclonaux ou leurs fragments, anticorps chimeriques 
ou immunoconjugues, caracterises en ce qu'ils sont capables de 
reconnaitre specifiquement un polypeptide selon I'une quelconque des 
revendications 1 a 4. 

25. Utilisation des anticorps selon la revendication precedence, pour la 
purification ou la detection d'un polypeptide selon I'une quelconque des 
revendications 1 a 4 dans un echantillon biologique. 

26. Procede de diagnostic in vitro de pathologies correlees a une expression 
ou une accumulation anormale de proteines SR-p70, notamment les 
phenomenes de cancerisation, a partir d'un prelevement biologique, 
caracterise en ce que Ton met en contact au moins un anticorps selon la 
revendication 24 avec ledit prelevement biologique, dans des conditions 
permettant la formation eventuelle de complexes immunologiques specifi- 
ques entre une proteine SR-p70 et le ou lesdits anticorps et en ce que 
Ton detecte les complexes immunologiques specifiques eventuellement 
formes. 

27. Kit pour le diagnostic in vitro d'une expression ou une accumulation 
anormale de proteines SR-p70 dans un prelevement biologique et/ou 
pour la mesure du taux d'expression de celles-ci dans ledit prelevement 
comprenant : 

- au moins un anticorps selon la revendication 24, eventuellement fixe sur 
-un. support, 

r - des moyens de revelation de la formation de complexes 
antigenes/anticorps specifiques entre une proteine SR-p70 et ledit 
anticorps et/ou des moyens de quantification de ces complexes. 

28. Methode pour le diagnostic precoce de la formation des tumeurs 
caracterisee en ce que Ton met en evidence dans un echantillon de 
serum preleve chez un individu des auto-anticorps diriges contre une 
proteine SR-p70 selon les etapes consistant a mettre en contact un 
echantillon de serum preleve chez un individu- avec un polypeptide de 
('invention, eventuellement fixe sur un support, dans des conditions 
permettant la formation de complexes immunologiques specifiques entre 
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(edit polypeptide et les auto-anticorps eventuellement presents dans 
Techantillon de serum, et en ce que Ton detecte les complexes 
immunologiques specifiques eventuellement formes. 

29. Composition pharmaceutique comprenant, a titre de principe actif, un 
polypeptide selon Tune quelconque des revendications 1 a 4. 

30. Composition pharmaceutique selon la revendication precedente, 
. . caracterisee en ce qu'elle comprend un polypeptide selon la revendication 

2. 



31. Composition pharmaceutique contenant un inhibiteur ou un activatour de 
I'activite du SR-p70. 



